成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MySQL 大批量插入,如何過濾掉重復(fù)數(shù)據(jù)?

數(shù)據(jù)庫 MySQL
加班原因是上線,解決線上數(shù)據(jù)庫存在重復(fù)數(shù)據(jù)的問題,發(fā)現(xiàn)了程序的bug,很好解決,有點(diǎn)問題的是,修正線上的重復(fù)數(shù)據(jù)。

[[407706]]

 加班原因是上線,解決線上數(shù)據(jù)庫存在重復(fù)數(shù)據(jù)的問題,發(fā)現(xiàn)了程序的bug,很好解決,有點(diǎn)問題的是,修正線上的重復(fù)數(shù)據(jù)。

線上庫有6個(gè)表存在重復(fù)數(shù)據(jù),其中2個(gè)表比較大,一個(gè)96萬+、一個(gè)30萬+,因?yàn)橹疤幚磉^相同的問題,就直接拿來了上次的Python去重腳本,腳本很簡單,就是連接數(shù)據(jù)庫,查出來重復(fù)數(shù)據(jù),循環(huán)刪除。

emmmm,但是這個(gè)效率嘛,實(shí)在是太低了,1秒一條,重復(fù)數(shù)據(jù)大約2萬+,預(yù)估時(shí)間大約在8個(gè)小時(shí)左右。。。

盲目依靠前人的東西,而不去自己思考是有問題的!總?cè)ハ胫霸趺纯梢裕F(xiàn)在怎么不行了,這也是有問題的!我發(fā)現(xiàn),最近確實(shí)狀態(tài)不太對,失去了探索和求知的欲望,今天算是一個(gè)警醒,頗有迷途知返的感覺。

言歸正傳,下面詳細(xì)介紹去重步驟。 

  1. CREATE TABLE `animal` (  
  2.   `id` int(11) NOT NULL AUTO_INCREMENT,  
  3.   `name` varchar(20) DEFAULT NULL,  
  4.   `age` int(11) DEFAULT NULL,  
  5.   PRIMARY KEY (`id`)  
  6. ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin 
  7. INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('1', 'cat', '12');  
  8. INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('2', 'dog', '13');  
  9. INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('3', 'camel', '25');  
  10. INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('4', 'cat', '32');  
  11. INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('5', 'dog', '42'); 

目標(biāo):我們要去掉name相同的數(shù)據(jù)。

先看看哪些數(shù)據(jù)重復(fù)了 

  1. SELECT name,count( 1 )   
  2. FROM  
  3.  student   
  4. GROUP BY  
  5. NAME   
  6. HAVING  
  7.  count( 1 ) > 1; 

輸出:

name count(1) cat 2 dog 2

name為cat和dog的數(shù)據(jù)重復(fù)了,每個(gè)重復(fù)的數(shù)據(jù)有兩條;

Select * From 表 Where 重復(fù)字段 In (Select 重復(fù)字段 From 表 Group By 重復(fù)字段 Having Count(1)>1)

刪除全部重復(fù)數(shù)據(jù),一條不留

直接刪除會(huì)報(bào)錯(cuò) 

  1. DELETE   
  2. FROM  
  3.  student   
  4. WHERE  
  5.  NAME IN (  
  6.  SELECT NAME   
  7.  FROM  
  8.   student   
  9.  GROUP BY  
  10.  NAME   
  11. HAVING  
  12.  count( 1 ) > 1) 

報(bào)錯(cuò):

1093 - You can't specify target table 'student' for update in FROM clause, Time: 0.016000s

原因是:更新這個(gè)表的同時(shí)又查詢了這個(gè)表,查詢這個(gè)表的同時(shí)又去更新了這個(gè)表,可以理解為死鎖。mysql不支持這種更新查詢同一張表的操作

解決辦法:把要更新的幾列數(shù)據(jù)查詢出來做為一個(gè)第三方表,然后篩選更新。 

  1. DELETE   
  2. FROM  
  3.  student   
  4. WHERE  
  5.  NAME IN (  
  6.  SELECT  
  7.   t.NAME   
  8. FROM  
  9.  ( SELECT NAME FROM student GROUP BY NAME HAVING count( 1 ) > 1 ) t) 

刪除表中刪除重復(fù)數(shù)據(jù),僅保留一條

在刪除之前,我們可以先查一下,我們要?jiǎng)h除的重復(fù)數(shù)據(jù)是啥樣的 

  1. SELECT  
  2.  *   
  3. FROM  
  4.  student   
  5. WHERE  
  6.  id NOT IN (  
  7.  SELECT  
  8.   t.id   
  9.  FROM  
  10.  ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t   
  11.  ) 

啥意思呢,就是先通過name分組,查出id最小的數(shù)據(jù),這些數(shù)據(jù)就是我們要留下的火種,那么再查詢出id不在這里面的,就是我們要?jiǎng)h除的重復(fù)數(shù)據(jù)。另外,關(guān)注Java知音公眾號,回復(fù)“后端面試”,送你一份面試題寶典!

開始刪除重復(fù)數(shù)據(jù),僅留一條

很簡單,剛才的select換成delete即可 

  1. DELETE   
  2. FROM  
  3.  student   
  4. WHERE  
  5.  id NOT IN (  
  6.  SELECT  
  7.   t.id   
  8.  FROM  
  9.  ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t   
  10.  ) 

90萬+的表執(zhí)行起來超級快。

All done  

 

責(zé)任編輯:龐桂玉 來源: Java知音
相關(guān)推薦

2021-09-14 13:15:43

MySQL數(shù)據(jù)庫腳本

2021-04-08 10:55:53

MySQL數(shù)據(jù)庫代碼

2020-11-02 09:53:13

Hive數(shù)據(jù)算法

2018-08-09 08:59:56

數(shù)據(jù)庫MySQL性能優(yōu)化

2020-12-18 10:40:00

ExcelJava代碼

2010-11-02 10:52:15

批量清理文件

2010-04-26 14:52:05

Oracle大批量數(shù)據(jù)

2010-07-16 09:57:44

SQL Server

2011-04-06 16:58:42

路由器ACL

2022-12-27 08:41:51

FastjsonJson字段

2024-05-30 13:06:40

2011-04-13 13:13:09

重復(fù)數(shù)據(jù)刪除

2024-10-16 17:04:13

2024-12-04 14:56:10

2009-04-01 13:43:35

索引開發(fā)MySQL

2019-11-22 10:24:17

開源技術(shù) 趨勢

2011-08-04 18:00:47

SQLite數(shù)據(jù)庫批量數(shù)據(jù)

2010-07-07 16:53:54

SQL Server重

2023-01-03 07:44:53

MySQL查詢重復(fù)

2013-04-01 15:03:58

Android開發(fā)Android批量插入
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 天天射美女 | 天天艹逼网 | 精品视频国产 | 国产成人精品一区二区三 | 亚洲精品片 | 国产精品1 | 日日做夜夜爽毛片麻豆 | 久久99国产精一区二区三区 | 精品久久久久久亚洲国产800 | 999久久久| 99精品国产一区二区三区 | 亚洲欧美视频 | www.久久影视| 一久久久 | 99热国产精品 | av在线一区二区三区 | 日日夜夜精品视频 | 国产精品久久久久久久 | 黄色免费网址大全 | 国产美女一区二区 | 色综合色综合 | 天天夜干| 久久中文视频 | 97avcc| 麻豆一区| 高清国产午夜精品久久久久久 | 一本岛道一二三不卡区 | 成人日韩| a级片在线观看 | 亚洲国产区 | 成人高清网站 | 亚洲欧美在线观看 | 91在线电影 | www.国产精品| 免费精品久久久久久中文字幕 | 久久小视频 | 黄色欧美在线 | 成人二区| 国产在线一区二区三区 | 欧美一区二区三区久久精品视 | 91精品一区二区三区久久久久久 |