數據庫中有個大表,需要查找其中的名字有重復的記錄id,以便比較。
如果僅僅是查找數據庫中name不重復的字段,很容易
- SELECT min(`id`),`name`
- FROM `table`
- GROUP BY `name`;
但是這樣并不能得到說有重復字段的id值。(只得到了最小的一個id值)
查詢哪些字段是重復的也容易
- SELECT `name`,count(`name`) as count
- FROM `table`
- GROUP BY `name` HAVING count(`name`) >1
- ORDER BY count DESC;
但是要一次查詢到重復字段的id值,就必須使用子查詢了,于是使用下面的語句來實現MySQL大表重復字段查詢。
- SELECT `id`,`name`
- FROM `table`
- WHERE `name` in (
- SELECT `name`
- FROM `table`
- GROUP BY `name` HAVING count(`name`) >1
- );
但是這條語句在mysql中效率太差,感覺mysql并沒有為子查詢生成零時表。
于是使用先建立零時表
- create table `tmptable` as (
- SELECT `name`
- FROM `table`
- GROUP BY `name` HAVING count(`name`) >1
- );
然后使用多表連接查詢
- SELECT a.`id`, a.`name`
- FROM `table` a, `tmptable` t
- WHERE a.`name` = t.`name`;
結果這次結果很快就出來了。
用 distinct去重復
- SELECT distinct a.`id`, a.`name`
- FROM `table` a, `tmptable` t
- WHERE a.`name` = t.`name`;
posted on 2012-05-25 14:15
方濤升 閱讀(255)
評論(0) 編輯 收藏 所屬分類:
j2ee