1
计算机应用基础
1.13.1.1 一、大数据的基本概念
一、大数据的基本概念

早在1980年,著名未来学家阿尔文·托夫勒(Alvin Toffler)便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。大数据或称巨量资料,指的是所涉及的资料规模大到无法透过当时主流软件和硬件工具,对其进行实时撷取、管理、处理并整理成为帮助企业经营决策的信息。

从技术层面看,大数据无法由单台计算机进行处理,必须采用分布式计算架构。其特色在于对海量数据的挖掘,但它又必须依托一些现有的数据处理方法,如云式处理、分布式数据库、云存储与虚拟化技术。

互联网是大数据的主要载体之一,可以说没有互联网就没有大数据。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年就将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数字传感器,随时测量和传递有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,必然会产生海量的数据信息。

大数据的意义在于可以通过人类日益普及的网络行为附带生成,并被相关部门、企业所采集,蕴含数据生产者的真实意图、喜好,其中包括传统结构和非传统结构数据。

从海量数据中“提纯”出有用的信息,对网络架构和数据处理能力而言无疑是巨大的挑战。在经历了几年的批判、质疑、讨论、炒作之后,人们终于迎来了大数据时代。2012年3月22日,美国政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。大数据将成为信息社会未来的“新能源”。

大数据的核心在于为客户从数据中挖掘出蕴藏的价值,而不是软硬件的堆砌。因此,针对不同领域的大数据应用模式、商业模式的研究和探索将是大数据产业健康发展的关键。