1
计算机应用基础
1.13.1.7 七、大数据的数据格式特性
七、大数据的数据格式特性

从IT角度来看,信息结构类型大致经历了三个阶段。必须注意的是,旧的阶段仍在不断发展,因此三种数据结构类型一直存在,只是其中一种结构类型往往主导其他结构。

1.结构化信息 这种信息可以在关系数据库中找到,多年来一直主导着IT应用,是关键任务OLTP系统业务所依赖的信息。另外,结构化信息还可对结构数据库信息进行排序和查询。

2.半结构化信息 包括电子邮件、文字处理文件及大量保存和发布在网络上的信息。半结构化信息是以内容为基础的,可以用于搜索,这也是Google等搜索引擎存在的理由。

3.非结构化信息 这种信息在本质上可认为主要是位映射数据。数据必须处于一种可感知的形式中,如可在音频、视频和多媒体文件中被听或看到。许多大数据都是非结构化的,其庞大规模和复杂性需要高级分析工具来创建,或利用一种更易于人们感知和交互的结构。