复习思考
上一节
下一节
思考题:
1. 简述大数据分析的流程及每一步的主要任务。
数据采集--尽可能全面的收集数据。
数据预处理--对数据进行清洗,便于分析。
数据分析--洞察用户行为,对用户行为进行预测,得到数据背后的信息。
2. 举例说明大数据的类型,分别有什么特点?
结构化数据有日期、电话号码、邮政编码、客户姓名,特点:明确定义、定量数据、容易访问、容易分析。
非结构化数据有文本、语音、监控数据、图片、HTML(超文本标记语言),特点:没有明确的定义、定性数据、难以获得、难以分析。
半结构化数据有电子邮件,特点:有定义性和一致性,在拥有一些组织属性的情况下,也保留了数据的流动性。
3. 营销实践中,可以通过哪些渠道收集用户数据,如何确保隐私保护等问题?
可以通过搜索引擎、电子商务平台、社交媒体平台来获得用户相关的营销大数据。
对数据的获取和使用不仅要合规化,还要符合伦理道德。
4. 数据预处理的流程是什么,对于大数据分析有什么作用?
数据预处理过程主要包括数据清洗、数据集成、数据变换、数据规约四个步骤。
数据预处理能够帮助改善数据质量,进而提高数据挖掘进程的有效性和准确性。

