在数据项目中,对于持续集成流水线的构建,如果采用应用软件的大包发布方式构建,则部署频率较低,且容易引起安全问题。 可能带来的问题有: 以 e2e 测试为主的测试用例,运行缓慢,导致流水线运行时间特别长一次性更新大规模的 ETL ,容易混入一些预期之外的更新离线的 ETL 任务不会立即反映问题,待运行时发现问题已经很晚了 联想到最近了解到的进口贸易业务问题,我发现可以借鉴其业务的抽取和拆分的模式,将持续集成流水线拆分为以 ETL 为单位的流水线。或许可以更好的解决上述问题。 阅读全文,请点击这里