ORACLE 多表查询优化收集整理

风格不统一 提交于 2019-12-05 15:39:19

  搞Web两年多了,从大学正式开始做项目算起,自己也接手了三四个项目了,积累了一些经验,最感谢的是大四的时候我的老师,非常信任我,让我完全负责一个项目,全套的,需求,设计,测试,发布等,全部我负责,当初很疯狂的说,整日整日的熬夜,现在工作大半年了,每天都按部就班的,每天过着悠哉的日子,很思念大学时候疯狂的日子,那些CD的日子一去不复返了。

  现在也没方向了,在社区里看到有人发帖也说了这个事情,大家都很纠结啊,所以觉得从根基开始,先从整理自己D盘那些收集的以及以前记录的一些心得体会。

  搞WEB的离不开数据库,在一个层面上,对数据库的熟练程度决定了很多的事情,大学时期的SqlServer Mysql 到现在用的Sysbase ORACLE 个人比较喜欢ORACLE 它的gui工具比较完善,比较好用,而且好像免费,只是服务不免费。

  本文就大家都纠结的ORACLE多表查询的性能问题给出一系列个优化方法,那这些都是项目中长期用到的,所以很熟,很熟,已经成为习惯了。

   ORACLE有个高速缓冲的概念,这个高速缓冲呢就是存放执行过的SQL语句,那oracle在执行sql语句的时候要做很多工作,例如解析sql语句,估算索引利用率,绑定变量,读取数据块等等这些操作。假设高速缓冲里已经存储了执行过的sql语句,那就直接匹配执行了,少了步骤,自然就快了,但是经过测试会发现高速缓冲只对简单的表起作用,多表的情况小完全没有效果啊,例如在查询单表的时候那叫一个快,但是假设连接多个表,就龟速了。

    最重要一点,ORACLE的高速缓冲是全字符匹配的,什么意思呢,看下面三个select

--No.1
select * from tableA;
--No.2
select * From tableA;
--No.3
select   * from tableA;

这三个语句乍一看是一样的,但是高速缓存是不认的,是全字符匹配的,索引在高速缓存里会存储三条不同的语句,说道这里,又引出一个习惯,就是要保持良好的编程习惯,这个很重要啊。

 ORACLE的多表优化我积累了一些,都是常用的,介绍下

第一点呢是From 子句后面的 表顺序有讲究

   先说为啥,ORACLE在解析sql语句的时候对From子句后面的表名是从右往左解析的,是先扫描最右边的表,然后在扫描左边的表,然后用左边的表匹配数据,匹配成功后就合并。

   所以,在对多表查询中,一定要把小表写在最右边,为什么自己想想就明白了。例如下面的两个语句:

--No.1  tableA 100w条记录  tableB 1w条记录 执行速度 十秒级
select count(*) from tableA,tableB;
  
--No.2  执行速度百秒级甚至更高
select count(*) from tableB,tableA;

这个估计很多人都知道,但是要确认非常有用。

还有一种是三张表的查询,例如

select count(1) from tableA a,tableB b ,tableC c where a.id=b.id and a.id=c.id;

上面种 tableA 就称为交叉表,根据oracle对From子句从右向左的扫描方式,应该把交叉表放在最末尾,然后才是最小表,所以上面的应该这样写

--tableA a 交叉表 
--tabelB b 100w
--tableC c 1w
select count(1) from tableB b ,tableC c ,tableA a where a.id=b.id and a.id=c.id;

这种写法对大数据量会非常有用,大家谨记,也是很常用的。

第二点呢是Where子句后面的条件过滤有讲究,ORACLE对where子句后面的条件过滤是自下向上,从右向左扫描的,所以和From子句一样一样的,把过滤条件排个序,按过滤数据的大小,自然就是最少数据的那个条件写在最下面,最右边,依次类推,例如

--No.1 不可取 性能低下
select * from tableA a where 
a.id>500
and a.lx = '2b'
and a.id < 'select count(1) from tableA  where id=a.id '

--No.2 性能高
select * from tableA a where 
a.id < 'select count(1) from tableA  where id=a.id '
and a.id>500
and a.lx = '2b'

第三点呢估计搞数据库的都知道啦,就是在select的时候少用*,多敲敲键盘,写上字段名吧,因为ORACLE的查询器会把*转换为表的全部列名,这个会浪费时间的,所以在大表中少用。

第四点呢就是要使用rowid 这个很好啊,可以用来分页,删除查询重复记录,很强大的,给两个例子:

--查找重复记录
select * from  tableA  a where
 a.rowid> (
 select min(rowid) from tableB b where 
 a.column=b.column
 ) 
--删除相同记录
delete from  tableA  a where
 a.rowid> (
 select min(rowid) from tableB b where 
 a.column=b.column
 ) 

--分页 start=10 limit=10
--end 为 start + limit
select * from 
(
  select A.*,Rownum rn from 
    (select * from tableA order by id) A
  where rownum <= 20
) b wehre rn> 10  order by id desc 

/*解释一下, 1.查询要排列的表 A
             2.查询A表的Rownum 找出小于end的数据 组成表B
             3.查询B表通过rownum找出大于start的数据 完成
简单的说先根据end值过滤数据,然后在根据start过滤数据
so 简单的
*/

第五点是存储过程中需要注意的,多用commit了,既可以释放资源,但是要谨慎啊。

第六点是减少对数据库表的查询,这个很重要,能减少就减少,因为在执行语句的时候oracle会做很多初始工作。

第七点不要用in啦,用exists来代替咯,例如:

--NO.1  IN的写法  
SELECT * FROM TABLEA A WHERE 
A.ID IN 
( SELECT ID FORM TABLEB B WHERE B.ID>1)

--NO.2 exists 写法
SELECT * FROM TABLEA A WHERE
EXISTS (
SELECT 1 FROM TABLEB B WHERE A.ID=B.ID AND B.ID>1)

相同的还有使用not exists 代替 not in ,方法雷同啊,就不介绍了。

那还有一些简单的方法,例如索引这些就比较简单了,就不介绍了,就写在这里吧。

每天整理一点,说不定可以找到方向啊,很迷茫啊,大侠们指点一下小弟啊,毕业才大半年就没得方向了。

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!