SQL中重复数据的查询与删除.docx
《SQL中重复数据的查询与删除.docx》由会员分享,可在线阅读,更多相关《SQL中重复数据的查询与删除.docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SQL 中重复数据的查询与删除=第一篇=在一张表中某个字段下面有重复记录,有很多方法,但是有一个方法,是比较高效的,如下语句:select data_guid from adam_entity_datas a where a.rowid (select min(b.rowid) from adam_entity_datas b where b.data_guid = a.data_guid)假设表中有大量数据,但是重复数据比较少,那么可以用下面的语句提高效率select data_guid from adam_entity_datas where data_guid in (select da
2、ta_guid from adam_entity_datas group by data_guid having count(*) 1)此方法查询出全部重复记录了,也就是说,只要是重复的就选出来,下面的语句或许更高效select data_guid from adam_entity_datas where rowid in (select rid from (select rowid rid,row_numberover(partition by data_guid order by rowid) m from adam_entity_datas) where m 1)目前只知道这三种比较有效
3、的方法。第一种方法比较好理解,但是最慢,其次种方法最快,但是选出来的记录是全部重复的记录, 而不是一个重复记录的列表,第三种方法,我认为最好。=其次篇=select usercode,count(*) from ptype group by usercode having count(*) 1=第三篇=找出重复记录的ID:select ID from( select ID ,count(*) as Cnt from 要消退重复的表group by ID) T1where Tt1删除数据库中重复数据的几个方法数据库的使用过程中由于程序方面的问题有时候会遇到重复数据,重复数据导致了数据库局部设置不
4、能正确设置方法一declare max integer,id integerdeclare cur_rows cursor local for select 主字段,count(*) from表名 group by 主字段 having count(*) 1 open cur_rowsfetch cur_rows into id,max while fetch_status=0beginselect max = max -1 set rowcount maxdelete from 表名 where 主字段 = id fetch cur_rows into id,maxendclose cur_
5、rows set rowcount 0方法二有两个意义上的重复记录,一是完全重复的记录,也即全部字段均重复的记录,二是局部关键字段重复的记录,比方Name 字段重复,而其他字段不肯定重复或都重复可以无视。1、对于第一种重复,比较简洁解决,使用select distinct * from tableName就可以得到无重复记录的结果集。假设该表需要删除重复的记录,可以按以下方法删除select distinct * into #Tmp from tableName drop table tableNameselect * into tableName from #Tmp drop table #
6、Tmp2、这类重复问题通常要求保存重复记录中的第一条记录,*作方法如下假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集select identity(int,1,1) as autoID, * into #Tmp from tableNameselect min(autoID) as autoID into #Tmp2 from #Tmp group byName,autoIDselect * from #Tmp where autoID in(select autoID from #tmp2)最终一个select 即得到了Name,Address 不重复的结果集更改
7、数据库中表的所属用户的两个方法大家可能会常常遇到一个数据库备份复原到另外一台机器结果导致全部的表都不能翻开了, 缘由是建表的时候承受了当时的数据库用户=第四篇=如何查询数据库中的重复记录?比方说有个表中的数据是这样:a a a b b c查询出的结果是: 记录 数量a 3b 2c 1怎样写这个SQL 语句?select distinct(name),count(*) from tabname group by name;想出来了,这样就可以排序了。select a1,count(a1) as total from tablename group by a1 order by total des
8、cselect distinct(a1),count(a1) as total from tablename group by a1 order by total desc加个 distinct 更有效率select p.*, m.* from table1 p left join table2 m on p.item1=m.item2 where p.item3='#$#%$' order by p.item3 asc limit 10就类似这么写=第五篇=如何查找数据库中的重复记录? 能在Access 中用的方法select *from 表 A inner join (se
9、lect 字段 1,字段 2 from 表 group by 字段 1,字段 2 having Count(*)1) B on A.字段 1=B.字段 1 and A.字段 2=B.字段 2问题:依据其中几个字段推断重复,只保存一条记录,但是要显示全部字段,怎么查询,感谢! 比方字段 1 字段 2 字段 3 字段 4 a b c 1a b c 1a b d 2 a b d 3b b d 2想得到的结果为a b c 1a b d 2或者 3 b b d 2说明,依据字段 1,2,3 组合不重复,字段 4 不考虑,得到了 3 个记录但是也要显示字段 4。方法一:可以用临时表的方法来解决:Curre
10、ntProject.Connection.Execute “drop table temptable“ CurrentProject.Connection.Execute “select * into temptable from 表 2 where 1=2“ CurrentProject.Connection.Execute “insert into temptable(字段 1,字段 2,字段 3) SELECT DISTINCT 表 2.字段 1, 表 2.字段 2, 表 2.字段 3 FROM 表 2;“CurrentProject.Connection.Execute “UPDATE
11、 temptable INNER JOIN表 2 ON (表 2.字段1 = temptable.字段1) AND (表2.字段2 = temptable.字段2) AND (表2.字段3 = temptable. 字段 3) SET temptable.字段 4 = 表 2.字段 4;“方法二:可以直接使用一个SELECT 查询筛选出需要的数据: 可以假定第四字段都选值最小的SELECT 1,2, 3, Min(4) AS Min4FROM 表 1GROUP BY 表 1.1, 表 1.2, 表 1.3;问题: 表 2id NAME r1 r21 1 w ee1 1 1 12321 2 12
12、3 1231 2 12 4341 2 123 1232 1 123 123ID 为数值,NAME 为字符。每条记录没有唯一标识。要求取得 ID 和 NAME 合并后不重复的记录,如有重复保存其中一条即可,但要显示全部记录。答复:SELECT a.*, (select top 1 r1 from表 2 as a1 where a1.id=a.id and a1.name=a.name) AS r1, (select top 1 r2 from 表 2 as a2 where a2.id=a.id and a2.name=a.name) AS r2FROM SELECT DISTINCT 表 2.
13、id, 表 2.NAME FROM 表 2. AS a;SELECT a.*, dlookup(“r1“,“表 2“,“id=“ & a.id & “ and name='“& a.name & “'“) AS r1, dlookup(“r2“,“表 2“,“id=“ & a.id & “ and name='“& a.name & “'“) AS r2FROM SELECT DISTINCT 表 2.id, 表 2.NAME FROM 表 2. AS a;留意,上述代码中由于没有唯一标识列,因此显示的 R1 R2 的先后次序无从确定,一般是按输入的先后挨次,但
14、是微软没有官方资料说明到底按哪个挨次,请网友留意。请留意,上述表2 为没有唯一标识字段,假设现在再建立一个自动编号字段“主键”则可以用以下代码SELECT a.ID, a.name, b.r1, b.r2, b.主键FROM (SELECT 表 2.id, 表 2.NAME, Min(表 2.主键) AS 主键FROM 表 2GROUP BY 表 2.id, 表 2.NAME) AS a inner JOIN 表 2 AS b ON a.主键=b.主键;=第六篇=1.查询数据库中重复的记录:select realname,count(*) from users group by realnam
15、e having count(*)1=第七篇=SELECT T0.ItemCode, T0.ItemName FROM OITM T0 WHERE exists (select 1 from OITM A where A.CODEBARS = TO.CODEBARS And A.ItemCode TO.ItemCode)=第八篇=信任很多人在查询数据库时都会遇到检索某表中不重复记录的时候,提到检索不重复记录, 马上想到确实定是Distinct 或者Group By 分组,小弟在初次使用的时候遇到了一些麻烦,这里拿出来与大家共享,期望对更多的朋友有所帮助!先看看数据库表构造:表名: TEST 字
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SQL 重复 数据 查询 删除
限制150内