论文部分内容阅读
【摘 要】查询语句的效率不高对数据库性能产生影响,为提升数据库系统的性能,应就SQL语句实施合理的优化,其实即为:把性能不高的SQL语句变为功能一样、而性能优异的一种SQL语句,通过对优化方法和技巧的研究提高SQL语句的效率,在一定程度上也就提高了查询的效率。
【关键词】数据库 SQL 语句的优化
设计、开发以及成品这些是数据库系统的一个生命周期。对于设计环节,针对数据库性能实施优化,花费最少、收益最高;但对于成品环节,又就数据库实施性能优化,花费最多、但收益最低。针对数据库性能优化而言,一般能对硬件、操作系统、数据库参数以及应用程序的优化。对硬件进行升级即为最普遍的优化办法,按照资料统计,可以看出,针对硬件、操作系统以及数据库参数作出的优化,得到的性能增加,全部加起来大概只提高40%左右,而60%的提升是来自对应用程序的优化;很多优化学者说,就应用程序实施优化,能让系统的性能增加80%。应用程序优化一般包括二方面:源代码以及SQL语句,源代码的优化因为牵涉到对程序逻辑的变更,对风险、时间与成本的要求非常高,但是就数据库系统性能的增加收效不好;因此常常运用对SQL语句的优化。
一、优化SQL语句的原因
对于数据库系统,最基本、常用、繁杂的操作就是查询,该操作在全部数据库操作之中占到的比例最高。在数据库系统累积达到某种程度,查询之时要是运用单条顺序扫描,扫描一次全部的记录会消耗掉几十分钟,有时更会几个小时,进而,系统失去即实的使用价值。运用何种查询策略,可以让查询时间变成几秒、几秒,如何更精确、简便的得到查询结果,就是要对SQL语句的优化问题。
查询优化为尽力找出和给定的表达式等价,同时执行效率很好的表达式,某查询通常存在多种实现方法,主要为怎样找出和它等价、同时操作时间花费少的一种表达式,查询优化关注的问题是怎样省时、省空间以及效率高。优化的核心问题是尽可能减少查询中各表的参与加工的数据量,最终实现优化空间与时间这一目的。
首先,因为SQL语句为就数据库实施操作的仅有途径,其决定了数据库系统的性能。
其次,因为SQL语句花费70%到90%的数据库资源。
第三,SQL语句因为和程序设计逻辑相独立,就SQL语句实施优化,影响不了程序逻辑。
再次,SQL语句本身存在不一样的写法,而于性能上有着很大差异。
最后,因为SQL语句学起来很简单,然而精通较难。
二、如何实施SQL语句优化
优化SQL语句的方法主要通过重写实施优化,DBA、有时也是资深程序员会对SQL语句执行计划进行合理研究,根据经验,对SQL语句重写,再就性能与结果作出对比,以便寻求到性能比较好的SQL语句。
(一)在查询Select语句中用Where子句限制返回的行数,避免表扫描,若返回不必要的数据,既浪费了服务器的I/O资源,又加重了网络的负担降低性能。
(二)在查询时不要返回不需要的行、列。
(三)在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,减少判断的次数。
(四)select中Where子句选择所有合适的行,Group By用来分组统计行,Having子句用来剔除多余的分组。如果Group BY的目的不包括计算,只是分组,那么用Distinct更快,Havin子句仅在聚集 Group By子句收集行之后才施加限制,这样导致全表扫描后再选择,若可以使用Where子句来代替 Having,则在扫描表的同时就进行了选择,其查询效率大大提高了。但是当Having子句用于聚集函数时不能由WHERE代替时则必须使用Having。
三、提升SQL语句的开发水平
(一)WHERE后面的条件顺序影响
WHERE子句后面的条件顺序对大数据量表的查询会产生直接的影响。如:
Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1
Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'
以上两个SQL中dy_dj(电压等级)及xh_bz(销户标志)两个字段都没进行索引,所以执行的时候都是全表扫描,第一条SQL的dy_dj = '1KV以下'条件在记录集内比率为99%,而xh_bz=1的比率只为0.5%,在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较,而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较,以此可以得出第二条SQL的CPU占用率明显比第一条低。
(二)查询表顺序的影响
在FROM后面的表中的列表顺序会对SQL执行性能影响,在没有索引及没有对表进行统计分析的情况下,就会按表出现的顺序进行链接,由此可见表的顺序不对时会产生十分耗服务器资源的数据交叉。
四、写出专家级的SQL语句
查询优化是关键的问题,其重点在于如何提高 SQL 的执行效率,所以选择什么样的查询语句是关键。进行数据库开发及其维护的时候,查询的优化能够提升系统的性能,针对很大数据量的数据库系统而言,显得更加重要。
写SQL语句时更主要的是理解优化的目的,所有的数据库优化就是一个原则,尽量少的逻辑读,尽量少的占内存,所以那些优化的细节并不是主要的,而是如何从运行的系统迅速定位问题,如果从SQL设计初期避免问题才是关键,它就能帮用户找到最佳的写法。
参考文献 :
[1]张孔倚.关于人工智能技术在情报检索中的应用.山西大学学报,2007(3)
[2]李明,沈红君.情报检索智能化.情报理论与实践,2005(6)
[3]涂序彦.人工智能及其应用.北京:清华大学出版社,2006。
【关键词】数据库 SQL 语句的优化
设计、开发以及成品这些是数据库系统的一个生命周期。对于设计环节,针对数据库性能实施优化,花费最少、收益最高;但对于成品环节,又就数据库实施性能优化,花费最多、但收益最低。针对数据库性能优化而言,一般能对硬件、操作系统、数据库参数以及应用程序的优化。对硬件进行升级即为最普遍的优化办法,按照资料统计,可以看出,针对硬件、操作系统以及数据库参数作出的优化,得到的性能增加,全部加起来大概只提高40%左右,而60%的提升是来自对应用程序的优化;很多优化学者说,就应用程序实施优化,能让系统的性能增加80%。应用程序优化一般包括二方面:源代码以及SQL语句,源代码的优化因为牵涉到对程序逻辑的变更,对风险、时间与成本的要求非常高,但是就数据库系统性能的增加收效不好;因此常常运用对SQL语句的优化。
一、优化SQL语句的原因
对于数据库系统,最基本、常用、繁杂的操作就是查询,该操作在全部数据库操作之中占到的比例最高。在数据库系统累积达到某种程度,查询之时要是运用单条顺序扫描,扫描一次全部的记录会消耗掉几十分钟,有时更会几个小时,进而,系统失去即实的使用价值。运用何种查询策略,可以让查询时间变成几秒、几秒,如何更精确、简便的得到查询结果,就是要对SQL语句的优化问题。
查询优化为尽力找出和给定的表达式等价,同时执行效率很好的表达式,某查询通常存在多种实现方法,主要为怎样找出和它等价、同时操作时间花费少的一种表达式,查询优化关注的问题是怎样省时、省空间以及效率高。优化的核心问题是尽可能减少查询中各表的参与加工的数据量,最终实现优化空间与时间这一目的。
首先,因为SQL语句为就数据库实施操作的仅有途径,其决定了数据库系统的性能。
其次,因为SQL语句花费70%到90%的数据库资源。
第三,SQL语句因为和程序设计逻辑相独立,就SQL语句实施优化,影响不了程序逻辑。
再次,SQL语句本身存在不一样的写法,而于性能上有着很大差异。
最后,因为SQL语句学起来很简单,然而精通较难。
二、如何实施SQL语句优化
优化SQL语句的方法主要通过重写实施优化,DBA、有时也是资深程序员会对SQL语句执行计划进行合理研究,根据经验,对SQL语句重写,再就性能与结果作出对比,以便寻求到性能比较好的SQL语句。
(一)在查询Select语句中用Where子句限制返回的行数,避免表扫描,若返回不必要的数据,既浪费了服务器的I/O资源,又加重了网络的负担降低性能。
(二)在查询时不要返回不需要的行、列。
(三)在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,减少判断的次数。
(四)select中Where子句选择所有合适的行,Group By用来分组统计行,Having子句用来剔除多余的分组。如果Group BY的目的不包括计算,只是分组,那么用Distinct更快,Havin子句仅在聚集 Group By子句收集行之后才施加限制,这样导致全表扫描后再选择,若可以使用Where子句来代替 Having,则在扫描表的同时就进行了选择,其查询效率大大提高了。但是当Having子句用于聚集函数时不能由WHERE代替时则必须使用Having。
三、提升SQL语句的开发水平
(一)WHERE后面的条件顺序影响
WHERE子句后面的条件顺序对大数据量表的查询会产生直接的影响。如:
Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1
Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'
以上两个SQL中dy_dj(电压等级)及xh_bz(销户标志)两个字段都没进行索引,所以执行的时候都是全表扫描,第一条SQL的dy_dj = '1KV以下'条件在记录集内比率为99%,而xh_bz=1的比率只为0.5%,在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较,而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较,以此可以得出第二条SQL的CPU占用率明显比第一条低。
(二)查询表顺序的影响
在FROM后面的表中的列表顺序会对SQL执行性能影响,在没有索引及没有对表进行统计分析的情况下,就会按表出现的顺序进行链接,由此可见表的顺序不对时会产生十分耗服务器资源的数据交叉。
四、写出专家级的SQL语句
查询优化是关键的问题,其重点在于如何提高 SQL 的执行效率,所以选择什么样的查询语句是关键。进行数据库开发及其维护的时候,查询的优化能够提升系统的性能,针对很大数据量的数据库系统而言,显得更加重要。
写SQL语句时更主要的是理解优化的目的,所有的数据库优化就是一个原则,尽量少的逻辑读,尽量少的占内存,所以那些优化的细节并不是主要的,而是如何从运行的系统迅速定位问题,如果从SQL设计初期避免问题才是关键,它就能帮用户找到最佳的写法。
参考文献 :
[1]张孔倚.关于人工智能技术在情报检索中的应用.山西大学学报,2007(3)
[2]李明,沈红君.情报检索智能化.情报理论与实践,2005(6)
[3]涂序彦.人工智能及其应用.北京:清华大学出版社,2006。