1.数据简介
肯定有很多小伙伴们听说过百度迁徙,那么它到底是什么呢?让我们来看一下来自百度迁徙官方机构百度慧眼的解释:“百度迁徙是基于百度地图开放平台地理位置服务进行计算分析得来,该项目由百度地图采用创新的可视化呈现方式,在业界首次全程、动态、即时、直观地展现出中国春节前后人口大迁徙的轨迹与特征。在春节迁徙项目中,用户可以直观地了解到各个城市之间人口短期流动情况。”
百度迁徙的网址为:http://qianxi.baidu.com/
2.数据来源
了解了百度迁徙的界面后,你是否会产生这样的疑问:这个数据来源于哪里呢?真的可靠么?
根据百度慧眼的说明,百度迁徙数据来源是百度地图开放平台海量的定位服务数据(LBS:基于位置的服务),也就是来源于所有选择使用百度基于地理位置API服务的软件。
官方显示,百度地图开放平台定位服务是广大开发者首选服务。从开发者角度,百度地图开放平台开发者数量超过165万,开发者市场占有率为75%,为超过65万活跃App及网站提供服务;从用户角度,百度定位服务每天响应全球位置服务请求超过1200亿次,这个庞大的位置请求数据是迁徙数据的基础。
由此可见,百度迁徙的数据基础十分雄厚可靠,可以算是大数据具有代表性的项目之一。
3. 迁入、迁出指数
效果展示
我们把获得的数据存成一个xls格式,因为csv换列不太方便(我不会)所以我选择了xls。这张图里表是某城市一月、二月一共两个月的迁出数据,左边第一列是所有城市的编码(身份证前6位,这也和url要求的编码一样),左边第二列是所有城市的名称,第一行是日期。然后为了让各位看官看到像百度迁徙网站那样的前一百名排序,我就特地点了排序截了一张图(1月1日排序)如下。(这两个是同一个表)
4. 数据获取
目前我们支持城市级、省级、全国的迁入迁出数据爬取服务,具体需要的时间段和城市/省份可联系文末客服定制。有python基础的用户也可直接获取后台经调试直接可用的爬取脚本(有偿),从而自由爬取任意所需城市/省份的数据.PS:会收取一些手工费,但可以保证的是,价格绝对低于某些平台的价格。