我们通过hive catalog外表同步数据,有时候hive表会很大导致内存占满了会杀掉其他任务自己同步也会失败,限制内存又会导致同步任务失败,有什么方法可以稳定一下呢,同步效率慢一点什么的也没问题
按照分区来吧,一次大数据量的话,容易OOM