目录

  • 1 初识大数据
    • 1.1 数字经济的由来与发展
    • 1.2 大数据内涵与特征
    • 1.3 大数据处理流程
  • 2 解密旅游大数据
    • 2.1 旅游大数据定义及特点
    • 2.2 常见的旅游大数据分析平台
    • 2.3 旅游大数据分析的应用场景
    • 2.4 旅游大数据分析的案例
  • 3 旅游大数据采集
    • 3.1 数据采集的概念
    • 3.2 旅游大数据的数据源
    • 3.3 数据搜索示例
    • 3.4 数据爬取工具功能与优势
  • 4 旅游大数据预处理
    • 4.1 旅游大数据概述
    • 4.2 数据清洗的流程与方法
    • 4.3 数据清洗的实例
  • 5 旅游大数据可视化
    • 5.1 游客画像分析
    • 5.2 旅游监测大屏制作
    • 5.3 旅游线路绘制
  • 6 旅游大数据隐私与安全
    • 6.1 大数据时代下的信息安全
    • 6.2 大数据的隐私问题
  • 7 模拟实战
    • 7.1 理论
旅游大数据的数据源

旅游大数据的数据源



一、数据源的多样化与个性化

面对多样的数据来源,从哪里找怎样找是当前旅游者和数据工作者面临的核心问题。根据下表了解数据资源分类。

第一方数据可以简单地被理解为企业在自己的平台上收集的属于自己的数据。

第二方数据可以简单地被理解为在外部平台上收集的属于自己的数据,主要包括社交媒体和电商数据两大类。

第三方数据可以简单地被理解为外部数据供应商拥有的数据,企业通过购买、交换、租赁等方式使用。

开放数据就是成本最低的选择。


二、旅游相关的开放数据

开放数据是指所有人均能访问的数据信息。这类数据的特点是多而庞杂,很难以人工方式进行处理,需要通过特定的方式实现自动化系统化的收集。一般采用爬虫技术收集此类数据内容。开放数据主要包含5类。

1. 政府、公益组织、学术社群等群体建设的开放型平台

如:

国家统计局数据库 https://data.stats.gov.cn/

上海市公共数据开放平台 https://data.sh.gov.cn/

北京市公共数据开放平台 https://data.beijing.gov.cn/

北京大学开放研究数据平台 https://opendata.pku.edu.cn/

联合国贸易与发展会议 https://unctadstat.unctad.org/EN/

世界银行公开数据 https://data.worldbank.org.cn/

2. 开发者计划接口平台

如:

百度数据开放平台 https://open.baidu.com/

高德开放平台 https://lbs.amap.com/

3. 营销类平台

如:

携程 https://www.ctrip.com/

途牛 https://www.tuniu.com/

马蜂窝 https://www.mafengwo.cn/

飞猪 https://www.fliggy.com/

4. 聚合搜索平台(搜索引擎)

百度 https://www.baidu.com/

搜狗知乎 https://zhihu.sogou.com/

搜狗微信 https://gzh.sogou.com/

微博搜索 https://s.weibo.com/

5. 其他

如:

大数据导航 https://hao.199it.com/

百度指数 https://index.baidu.com/

360趋势 https://trends.so.com/