最近接到一个数据迁移的需求,旧系统的数据迁移到新系统;旧系统不会再新增业务数据,业务操作都在新系统上进行
为了降低迁移的影响,数据进行分批迁移,也就是说新旧系统会并行一段时间
数据分批不是根据 id 范围来分的,也就说每批数据的 id 都是无规律的
另外,为了保证新旧系统数据的对应,新系统的 id 尽可能的沿用旧系统的 id
因为表 id 在新旧系统都是自增的,所以迁移的时候,旧系统的 id 可能在新系统已经被占用了,类似如下
需求描述
数据迁移的时候,尽可能沿用旧系统的 id,而冲突的 id 需要进行批量调整 如何调整这批冲突的 id,正是我当下要实现的需求
我的实现是根据业务数据的增长情况,结合目前新系统的最大 id 来预设一个起始的 id
这个 SQL 该如何写?
需求实现
如果大家对 UDPATE 的执行流程了解的话,那就更好理解了
UPDATE 其实有两个阶段: 查阶段 、 更新阶段
一行一行的处理,查到一行满足 WHERE 子句,就更新一行
所以,这里的 ORDER BY 就和 SELECT 中的 ORDER BY 是一样的效果
关于使用场景,大家可以回过头去看看前面讲到的的需求背景,
IGNORE 的案例 1 中的报错,其实也可以用 ORDER BY
LIMIT