MySQL 中删除重复的数据并只保留一条

打印 上一主题 下一主题

主题 943|帖子 943|积分 2829

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
要在 MySQL 中删除重复的数据并只保留一条,可以利用下面的方法。
方法一:创建临时表

这种方法假设你有一个表 your_table,并且你要基于某些列来判断哪些数据是重复的。例如,假如你想删除基于 column1 和 column2 的重复记录,只保留一条记录,你可以按照以下步骤操作:

  • 利用 CREATE TABLE 语句创建一个临时表,用于存储唯一的记录。
  • 利用 INSERT INTO ... SELECT 语句将唯一的记录插入到临时表中。
  • 删除原始表中的全部记录。
  • 利用 INSERT INTO ... SELECT 语句将临时表中的记录插入回原始表。
  • 删除临时表。
以下是一个完备的 SQL 例子:
  1. -- Step 1: Create a temporary table
  2. CREATE TABLE temp_table AS
  3. SELECT * FROM your_table
  4. WHERE 1=0;  -- Create an empty table with the same structure as your_table
  5. -- Step 2: Insert unique records into the temporary table
  6. INSERT INTO temp_table
  7. SELECT * FROM your_table t1
  8. WHERE t1.id = (
  9.     SELECT MIN(t2.id)
  10.     FROM your_table t2
  11.     WHERE t1.column1 = t2.column1
  12.     AND t1.column2 = t2.column2
  13. );
  14. -- Step 3: Delete all records from the original table
  15. DELETE FROM your_table;
  16. -- Step 4: Insert the records back from the temporary table to the original table
  17. INSERT INTO your_table
  18. SELECT * FROM temp_table;
  19. -- Step 5: Drop the temporary table
  20. DROP TABLE temp_table;
复制代码
解释:

  • 创建临时表:CREATE TABLE temp_table AS SELECT * FROM your_table WHERE 1=0; 这行代码创建了一个空的临时表,其结构与 your_table 相同。
  • 插入唯一记录:INSERT INTO temp_table SELECT * FROM your_table t1 WHERE t1.id = (SELECT MIN(t2.id) FROM your_table t2 WHERE t1.column1 = t2.column1 AND t1.column2 = t2.column2); 这行代码将唯一记录插入到临时表中,基于 column1 和 column2 进行去重,只保留 id 最小的记录。
  • 删除原始表中的全部记录:DELETE FROM your_table; 删除原始表中的全部记录。
  • 将临时表中的记录插入回原始表:INSERT INTO your_table SELECT * FROM temp_table; 将临时表中的记录插入回原始表。
  • 删除临时表:DROP TABLE temp_table; 删除临时表。
如许,你就成功地删除了原始表中的重复记录,只保留了一条唯一记录。
方法二:自连查询

上面的这个方案不太行,会改变原来的数据id
为了避免改变原来的数据 ID,我们可以利用一个不同的方法,通过利用自连接来标记重复的数据并删除多余的记录。这种方法在保留原始 ID 的情况下删除重复记录。
假设你的表结构如下:


  • 表名:your_table
  • 列名:id (主键), column1, column2, 以及其他列。
你可以利用以下 SQL 语句来删除重复记录,只保留一条(通常是保留 ID 最小的那一条):
  1. -- Step 1: 标记要删除的重复记录
  2. DELETE t1
  3. FROM your_table t1
  4. INNER JOIN your_table t2
  5. WHERE
  6.     t1.id > t2.id
  7.     AND t1.column1 = t2.column1
  8.     AND t1.column2 = t2.column2;
  9. -- Step 2: 确认删除成功,查看剩余数据
  10. SELECT * FROM your_table;
复制代码
解释:

  • 标记要删除的重复记录:我们利用自连接 INNER JOIN 来找到重复的记录,并且利用 WHERE t1.id > t2.id 来确保只删除 id 较大的记录,从而保留 id 最小的记录。
  • 确认删除成功:通过 SELECT 语句查看剩余的数据,确保删除操作正确。
这个方法的优点是:


  • 不会改变原始数据的 ID。
  • 保留每组重复记录中 ID 最小的一条记录。
  • 操作简单且高效。
方法三:利用子查询

当然,还有其他方案可以在不改变原始数据 ID 的情况下删除重复记录。
利用子查询来保留每组重复记录中 ID 最小的一条记录,并删除别的的重复记录。
  1. DELETE FROM your_table
  2. WHERE id NOT IN (
  3.     SELECT MIN(id)
  4.     FROM your_table
  5.     GROUP BY column1, column2
  6. );
复制代码
解释:


  • 子查询:SELECT MIN(id) FROM your_table GROUP BY column1, column2 获取每组重复记录中 ID 最小的记录。
  • 删除记录:DELETE FROM your_table WHERE id NOT IN (...) 删除那些不在子查询结果中的记录,即删除重复记录中 ID 不是最小的记录。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

小小小幸运

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表