大数据的概念
上一节
下一节

大数据(Big Data):无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
一般而言,大数据是指在一定的时间范围内无法用常规软件工具进行获取、存储、管理和分析的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
数据的量级
数据的大小用计算机存储容量的单位来表示。比特(bit),字节(Byte),TB、PB、EB(艾字节)、ZB、YB。

大数据的特征
大数据具有5V特征:Volume(体量大)、Varity(类型多)、Velocity(速度快)、Value(价值性)、Veracity(真实性)。

大数据的类型
1.按照数据结构分类
按照数据结构分类,数据可以分为结构化数据和非结构化数据。其中,非结构化数据又包含半结构化数据和无结构的数据。传统上使用的是结构化数据。
不方便用数据库二维逻辑表达的数据为非结构化数据。非结构化数据是非纯文本类型的数据,非结构化数据是产生大数据的主要来源。
2.按照数据的产生分类
(1)数据产生的方式
互联网、移动互联网、物联网的快速兴起,使数据的产生方式发生了变化,出现了数据的产生由企业内部向企业外部扩展、由Web 1.0向Web2.0展、由互联网向移动互联网扩展、由互联网向物联网打展4种趋势。
(2)数据产生的主体


