论文部分内容阅读
摘 要:随着信息化技术的快速发展,人们获取信息的求知欲也在水涨船高,而oracle系统只侧重于通过开发来实现企业业务流程,匹配企业管理,关注开发质量和后期的维护。所以为了在实践中高效、准确、快速地获得数据,笔者研究了0racle的查询优化技术,通过对oracle索引性能的阐述,重点就oracle查询优化技术做了探讨和研究。
关键词:0racle;物资数据;查询优化技术
Oracle ERP整个企业一个“控制中心”为最好地利用企业的资源,这一“控制中心”将收集不同部门的状态信息和进度报表,然后提供给其他部门。信息由用户实时更新,且有需要的用户可在任何时候访问。模块化方法许多企业并不需要典型 ERP 套件中提供的所有功能。因此这些套件通常以模块化形式提供,允许公司仅实施其所需的模块,以后需要的话再添加更多模块。Oracle 还提供一系列行业特定的模块,纳入了用于特定行业的最佳实践功能和流程。Oracle采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他Where条件之前。
一、Oracle 数据库系统
Oracle 数据库系统是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。Oracle数据库是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。但它的所有知识,只要在一种机型上学习了ORACLE知识,便能在各种类型的机器上使用它。Oracle数据库最新版本为Oracle Database 12c。Oracle数据库12c 引入了一个新的多承租方架构,使用该架构可轻松部署和管理数据库云。
二、Oracle中索引性能及优化器选用
(一)Oracle索引性能分析
索引是表的一个概念部分,用来提高检索数据的效率,ORACLE使用了一个复杂的自平衡B-tree结构。通常,通过索引查询数据比全表扫描要快。当ORACLE找出执行查询和Update语句的最佳路径时, Oracle优化器将使用索引。同样在联结多个表时使用索引也可以提高效率,另一个使用索引的好处是,它提供了主键(primary key)的唯一性验证。那些LONG或LONG RAW数据类型,可以索引几乎所有的列,通常在大型表中使用索引特别有效。在扫描小表时,使用索引同样能提高效率。影响SQL性能的因素很多,如初始化参数设置不合理、导入了不准确的系统统计数据从而影响优化程序的正确判断等,这些与DBA密切相关。
(二)Oracle优化器的选用
Oracle的优化器共有3种: RULE (基于规则)、COST (基于成本)、CHOOSE (选择性)。设置缺省的优化器,可以通过对init.ora文件中OPTIMIZER_MODE参数的各种声明,如Rule,Cost,Choose,ALL_ROWS,First_ROWS. 你当然也在SQL句级或是会话(session)级对其进行覆盖。为了使用基于成本的优化器(CBO, Cost-Based Optimizer), 你必须经常运行analyze 命令,以增加数据库中的对象统计信息(object statistics)的准确性。如果数据库的优化器模式设置为选择性(Choose),那么实际的优化器模式将和是否运行过analyze命令有关。如果table已经被analyze过, 优化器模式将自动成为Cbo。
三、oracle查询优化技术分析
(一)避免使用IS NOT NULL
避免在索引中使用任何可以为空的列,ORACLE性能上将无法使用该索引。对于单列索引,如果列包含空值,索引中将不存在此记录。 对于复合索引,如果每个列都为空,索引中同样不存在此记录。如果至少有一个列不为空,则记录存在于索引中。如果唯一性索引建立在表的A列和B列上, 并且表中存在一条记录的A,B值为(123,null), ORACLE将不接受下一条具有相同A,B值(123,null)的记录(插入)。然而如果所有的索引列都为空,ORACLE将认为整个键值为空而空不等于空。因此可以插入1000 条具有相同键值的记录。
代码如下:
低效:(索引失效) SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效:(索引有效) SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;
(二)避免改变索引列的类型
当比较不同数据类型的数据时, ORACLE自动对列进行简单的类型转换。假设 EMPNO是一个数值类型的索引列。SELECT … FROM EMP WHERE EMPNO = ‘123' 实际上,经过ORACLE类型转换, 语句转化为: SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')。类型转换没有发生在索引列上,索引的用途没有被改变。假设EMP_TYPE是一个字符类型的索引列,SELECT … FROM EMP WHERE EMP_TYPE = 123 这个语句被ORACLE转换为: SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123 因为内部发生的类型转换, 这个索引将不会被用到。
(三)避免使用耗费资源的操作
带有DISTINCT, UNION, MINUS, INTERSECT的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能,DISTINCT需要一次排序操作, 而其他的至少需要执行两次排序。通常, 带有UNION, MINUS , INTERSECT的SQL语句都可以用其他方式重写。如果数据库的SORT_AREA_SIZE调配得好,使用UNION, MINUS, INTERSECT也是可以考虑的, 毕竟它们的可读性很强。 (四)不同功能的替换操作分析
通常情况下, 用UNION替换Where子句中的OR将会起到较好的效果, 对索引列使用OR将造成全表扫描。此方法只针对多个索引列有效,如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低,在下面的例子中, LOC_ID 和REGION上都建有索引。如果坚持要用OR, 那就需要返回记录最少的索引列写在最前面。当SQL语句需要UNION两个查询结果集合时,这两个结果集合会以UNION-ALL的方式被合并, 然后在输出最终结果前进行排序。如果用UNION ALL替代UNION,效率就会因此得到提高,需要注意的是,UNION ALL 将重复输出两个结果集合中相同记录。因此各位还是要从业务需求分析使用UNION ALL的可行性,UNION 将对结果集合排序,这个操作会使用到SORT_AREA_SIZE这块内存,对于这块内存的优化也是相当重要的。
代码如下:
高效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION ALL SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE”
低效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT。一般可以考虑用EXIST替换, EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。
(低效): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D, EMP E
WHERE D.DEPT_NO = E.DEPT_NO
And E.sex =man
(高效): SELECT DEPT_NO,DEPT_NAME FROM DEPT D
WHERE EXISTS
( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO
And E.sex =man);
优化GROUP BY: 提高GROUP BY 语句的效率, 可以通过将不需要的记录在GROUP BY 之前过滤掉,用Where替代Having。下面两个查询返回相同结果但第二个明显就快了许多。
低效:
SELECT JOB , AVG(SAL)
FROM EMP GROUP JOB HAVING JOB = ‘PRESIDENT'AND AVG(SAL)>XXX
高效:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER' GROUP JOB Having AND AVG(SAL)>XXX
综上所述,复杂的SQL往往牺牲了执行效率,能够运用函数解决问题的方法在实际工作中是非常有意义的。数据库最基本的任务是存储、管珲数据,而终端用户唯一能看到的数据库特性就是其性能。以ERP项目的物资数据的查询和统计为背景和依据,分析导致SQL查询语句性能低下的原因以及SQL优化的方法,重点阐述在查询语句中如何避免对查询结果的高成本操作以及在对多表连接时如何提高查询效率。
参考文献:
[1]杨德江.数据库SQL查询技术的优化策略[J].计算机与现代化,2014.
[2]付忠和.0mcle数据库中大型表查询优化的研究[J].现代电子技术,2015.
关键词:0racle;物资数据;查询优化技术
Oracle ERP整个企业一个“控制中心”为最好地利用企业的资源,这一“控制中心”将收集不同部门的状态信息和进度报表,然后提供给其他部门。信息由用户实时更新,且有需要的用户可在任何时候访问。模块化方法许多企业并不需要典型 ERP 套件中提供的所有功能。因此这些套件通常以模块化形式提供,允许公司仅实施其所需的模块,以后需要的话再添加更多模块。Oracle 还提供一系列行业特定的模块,纳入了用于特定行业的最佳实践功能和流程。Oracle采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他Where条件之前。
一、Oracle 数据库系统
Oracle 数据库系统是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。Oracle数据库是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。但它的所有知识,只要在一种机型上学习了ORACLE知识,便能在各种类型的机器上使用它。Oracle数据库最新版本为Oracle Database 12c。Oracle数据库12c 引入了一个新的多承租方架构,使用该架构可轻松部署和管理数据库云。
二、Oracle中索引性能及优化器选用
(一)Oracle索引性能分析
索引是表的一个概念部分,用来提高检索数据的效率,ORACLE使用了一个复杂的自平衡B-tree结构。通常,通过索引查询数据比全表扫描要快。当ORACLE找出执行查询和Update语句的最佳路径时, Oracle优化器将使用索引。同样在联结多个表时使用索引也可以提高效率,另一个使用索引的好处是,它提供了主键(primary key)的唯一性验证。那些LONG或LONG RAW数据类型,可以索引几乎所有的列,通常在大型表中使用索引特别有效。在扫描小表时,使用索引同样能提高效率。影响SQL性能的因素很多,如初始化参数设置不合理、导入了不准确的系统统计数据从而影响优化程序的正确判断等,这些与DBA密切相关。
(二)Oracle优化器的选用
Oracle的优化器共有3种: RULE (基于规则)、COST (基于成本)、CHOOSE (选择性)。设置缺省的优化器,可以通过对init.ora文件中OPTIMIZER_MODE参数的各种声明,如Rule,Cost,Choose,ALL_ROWS,First_ROWS. 你当然也在SQL句级或是会话(session)级对其进行覆盖。为了使用基于成本的优化器(CBO, Cost-Based Optimizer), 你必须经常运行analyze 命令,以增加数据库中的对象统计信息(object statistics)的准确性。如果数据库的优化器模式设置为选择性(Choose),那么实际的优化器模式将和是否运行过analyze命令有关。如果table已经被analyze过, 优化器模式将自动成为Cbo。
三、oracle查询优化技术分析
(一)避免使用IS NOT NULL
避免在索引中使用任何可以为空的列,ORACLE性能上将无法使用该索引。对于单列索引,如果列包含空值,索引中将不存在此记录。 对于复合索引,如果每个列都为空,索引中同样不存在此记录。如果至少有一个列不为空,则记录存在于索引中。如果唯一性索引建立在表的A列和B列上, 并且表中存在一条记录的A,B值为(123,null), ORACLE将不接受下一条具有相同A,B值(123,null)的记录(插入)。然而如果所有的索引列都为空,ORACLE将认为整个键值为空而空不等于空。因此可以插入1000 条具有相同键值的记录。
代码如下:
低效:(索引失效) SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效:(索引有效) SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;
(二)避免改变索引列的类型
当比较不同数据类型的数据时, ORACLE自动对列进行简单的类型转换。假设 EMPNO是一个数值类型的索引列。SELECT … FROM EMP WHERE EMPNO = ‘123' 实际上,经过ORACLE类型转换, 语句转化为: SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')。类型转换没有发生在索引列上,索引的用途没有被改变。假设EMP_TYPE是一个字符类型的索引列,SELECT … FROM EMP WHERE EMP_TYPE = 123 这个语句被ORACLE转换为: SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123 因为内部发生的类型转换, 这个索引将不会被用到。
(三)避免使用耗费资源的操作
带有DISTINCT, UNION, MINUS, INTERSECT的SQL语句会启动SQL引擎执行耗费资源的排序(SORT)功能,DISTINCT需要一次排序操作, 而其他的至少需要执行两次排序。通常, 带有UNION, MINUS , INTERSECT的SQL语句都可以用其他方式重写。如果数据库的SORT_AREA_SIZE调配得好,使用UNION, MINUS, INTERSECT也是可以考虑的, 毕竟它们的可读性很强。 (四)不同功能的替换操作分析
通常情况下, 用UNION替换Where子句中的OR将会起到较好的效果, 对索引列使用OR将造成全表扫描。此方法只针对多个索引列有效,如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低,在下面的例子中, LOC_ID 和REGION上都建有索引。如果坚持要用OR, 那就需要返回记录最少的索引列写在最前面。当SQL语句需要UNION两个查询结果集合时,这两个结果集合会以UNION-ALL的方式被合并, 然后在输出最终结果前进行排序。如果用UNION ALL替代UNION,效率就会因此得到提高,需要注意的是,UNION ALL 将重复输出两个结果集合中相同记录。因此各位还是要从业务需求分析使用UNION ALL的可行性,UNION 将对结果集合排序,这个操作会使用到SORT_AREA_SIZE这块内存,对于这块内存的优化也是相当重要的。
代码如下:
高效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION ALL SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE”
低效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT。一般可以考虑用EXIST替换, EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。
(低效): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D, EMP E
WHERE D.DEPT_NO = E.DEPT_NO
And E.sex =man
(高效): SELECT DEPT_NO,DEPT_NAME FROM DEPT D
WHERE EXISTS
( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO
And E.sex =man);
优化GROUP BY: 提高GROUP BY 语句的效率, 可以通过将不需要的记录在GROUP BY 之前过滤掉,用Where替代Having。下面两个查询返回相同结果但第二个明显就快了许多。
低效:
SELECT JOB , AVG(SAL)
FROM EMP GROUP JOB HAVING JOB = ‘PRESIDENT'AND AVG(SAL)>XXX
高效:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER' GROUP JOB Having AND AVG(SAL)>XXX
综上所述,复杂的SQL往往牺牲了执行效率,能够运用函数解决问题的方法在实际工作中是非常有意义的。数据库最基本的任务是存储、管珲数据,而终端用户唯一能看到的数据库特性就是其性能。以ERP项目的物资数据的查询和统计为背景和依据,分析导致SQL查询语句性能低下的原因以及SQL优化的方法,重点阐述在查询语句中如何避免对查询结果的高成本操作以及在对多表连接时如何提高查询效率。
参考文献:
[1]杨德江.数据库SQL查询技术的优化策略[J].计算机与现代化,2014.
[2]付忠和.0mcle数据库中大型表查询优化的研究[J].现代电子技术,2015.