数据仓库的物理模型设计
上一节
下一节
数据仓库的物理模型设计
一、确定数据的存储结构
一个数据仓库开发工具往往都提供多种存储结构供设计人员选用,不同的存储结构有不同的实现方式,各有各的适用范围和优缺点。设计人员在选择合适的存储结构时应该权衡三个方面的主要因素:存取时间、存储空间利用率和维护代价。
同一个主题的数据并不要求存放在相同的介质上。在物理设计时,常常要按数据的重要程度、使用频率以及对响应时间的要求进行分类,并将不同类的数据分别存储在不同的存储设备中。重要程度高、经常存取并对响应时间要求高的数据就存放在高速存储设备上,如硬盘;存取频率低或对存取响应时间要求低的数据则可以放在低速存储设备上,如磁盘或磁带。
此外,还要考虑如下策略:
1、合并表组织

图 合并表
2、引入冗余
3、分割表组织
4、生成导出数据
二、确定索引策略
数据仓库的数据量很大,因而需要对数据的存取路径进行仔细的设计和选择。
由于数据仓库的数据都是不常更新的,因而可以设计多种多样的索引结构来提高数据存取效率。
设计人员可以考虑对各个数据存储建立专用的、复杂的索引,以获得最高的存取效率。
三、确定存储分配
许多数据仓库开发工具提供了一些存储分配的参数供设计者进行物理优化处理,例如,块的尺寸、缓冲区的大小和个数等等,它们都要在物理设计时确定。

