l 查询优化在关系数据库系统中有着非常重要的地位
l 关系查询优化是影响关系数据库管理系统性能的关键因素
l 由于关系表达式的语义级别很高,使关系系统可以从关系表达式中分析查询语义,提供了执行查询优化的可能性
关系数据库系统的优化既是 RDBMS 实现的关键技术又是关系系统的优点所在。它减轻了用户选择存取路径的负担。用户只要提出“干什么”,不必指出“怎么干”。查询优化的优点不仅在于用户不必考虑如何最好地表达查询以获得较好的效率,而且在于系统可以比用户程序的“优化’做得更好。
l 关系系统的查询优化
l 是关系数据库管理系统实现的关键技术又是关系系统的优点所在
l 减轻了用户选择存取路径的负担
l 非关系系统
l 用户使用过程化的语言表达查询要求,执行何种记录级的操作,以及操作的序列是由用户来决定的
l 用户必须了解存取路径,系统要提供用户选择存取路径的手段,查询效率由用户的存取策略决定
l 如果用户做了不当的选择,系统是无法对此加以改进的
l 查询优化的优点
l 用户不必考虑如何最好地表达查询以获得较好的效率
l 系统可以比用户程序的“优化”做得更好
l (1) 优化器可以从数据字典中获取许多统计信息,而用户程序则难以获得这些信息。
l (2)如果数据库的物理统计信息改变了,系统可以自动对查询重新优化以选择相适应的执行计划。在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的。
l (3)优化器可以考虑数百种不同的执行计划,程序员一般只能考虑有限的几种可能性。
l (4)优化器中包括了很多复杂的优化技术,这些优化技术往往只有最好的程序员才能掌握。系统的自动优化相当于使得所有人都拥有这些优化技术。
l 关系数据库管理系统通过某种代价模型计算出各种查询执行策略的执行代价,然后选取代价最小的执行方案
l 集中式数据库
l 执行开销主要包括
l 磁盘存取块数(I/O代价)
l 处理机时间(CPU代价)
l 查询的内存开销
l I/O代价是最主要的
l 分布式数据库
l 总代价=I/O代价+CPU代价+内存代价+通信代价
l 查询优化的总目标
l 选择有效的策略
l 求得给定关系表达式的值
l 使得查询代价最小(实际上是较小)