旅游大数据的数据源
一、数据源的多样化与个性化
面对多样的数据来源,从哪里找和怎样找是当前旅游者和数据工作者面临的核心问题。根据下表了解数据资源分类。

第一方数据可以简单地被理解为企业在自己的平台上收集的属于自己的数据。
第二方数据可以简单地被理解为在外部平台上收集的属于自己的数据,主要包括社交媒体和电商数据两大类。
第三方数据可以简单地被理解为外部数据供应商拥有的数据,企业通过购买、交换、租赁等方式使用。
开放数据就是成本最低的选择。
二、旅游相关的开放数据
开放数据是指所有人均能访问的数据信息。这类数据的特点是多而庞杂,很难以人工方式进行处理,需要通过特定的方式实现自动化系统化的收集。一般采用爬虫技术收集此类数据内容。开放数据主要包含5类。
1. 政府、公益组织、学术社群等群体建设的开放型平台
如:
国家统计局数据库 https://data.stats.gov.cn/
上海市公共数据开放平台 https://data.sh.gov.cn/
北京市公共数据开放平台 https://data.beijing.gov.cn/
北京大学开放研究数据平台 https://opendata.pku.edu.cn/
联合国贸易与发展会议 https://unctadstat.unctad.org/EN/
世界银行公开数据 https://data.worldbank.org.cn/
2. 开发者计划接口平台
如:
百度数据开放平台 https://open.baidu.com/
高德开放平台 https://lbs.amap.com/
3. 营销类平台
如:
携程 https://www.ctrip.com/
马蜂窝 https://www.mafengwo.cn/
4. 聚合搜索平台(搜索引擎)
百度 https://www.baidu.com/
搜狗微信 https://gzh.sogou.com/
微博搜索 https://s.weibo.com/
5. 其他
如:
大数据导航 https://hao.199it.com/
百度指数 https://index.baidu.com/
360趋势 https://trends.so.com/

