吴海山在普林斯顿大学(Princeton University)研究鱼群集体行为时被一个更庞大群体所吸引:13.5亿中国。吴海山在普林斯顿大学(Princeton University)研究鱼群集体行为时被一个更庞大群体所吸引:13.5亿中国。
那是2014年的春节,中国最大搜索引擎运营商百度打造了一部讲述各阶层人群春节回家的微电影。一年一度的春运是世界上规模最大的人类迁徙活动。吴海山很快加入了总部位于的百度公司,担任数据科学家。他的工作是通过追踪用户信息来测算经济指标,如哪些城区是鬼城,多少人在买车。
“我们像是在到处跑,把手电筒射向各个地方,比如说劳动力和港口、”大学光华管理学院的投资学教授杰弗里?陶森(Jeffrey Towson)表示。“这些新信息旨在改善现有信息。就像是打开灯,突然你就看到了一切。”
如今,各种数据源的大爆发让投资者可以从新角度来看待中国这个世界上最大的贸易国。中国最主要的银行卡处理机构中国银联在一周内可以处理数亿次交易。阿里巴巴上个财年的网购交易额为3.1万亿元人民币(约合4850亿美元),几乎相当于的国内生产总值。
百度每日的搜索量达到60亿次,而且在移动地图服务领域占主导地位,这为百度提供了移户的数据和使用百度地图服务的应用软件所收集的数据。例如,这些数据可以显示有多少人在逛苹果商店,从而能推断出多少人对新iPhone有购买兴趣。
吴海山还用搜索数据和地图数据来定位所谓的鬼城,也就是那些几乎没有移动手机活动的楼盘。他带领一支10人的团队利用该技术编制了多项指标,包括商场客流量、旅游出行人数以及高科技就业情况。
“我们不知道这样做有没有商业价值。”吴海山在位于西北的百度办公园区接受采访时表示。但机构投资者看到了商业价值,他们在6月吴海山发布指标后迅速找上门来。
非的民新制造业指数2016年被暂停发布,市场研究机构Markit Economics和财新传媒联合编制的制造业指数初值也在2015年被叫停。
大数据则提供了另一种可能性。曾在麦肯锡公司(McKinsey & Co.)做分析员、如今加入了阿里巴巴研究部门的程欣正在利用阿里巴巴的贸易数据来编制一个P类型的指标。该指标将从淘宝上读取数据,中国最大房地产门户网站搜房网的交易数据等也会被纳入其中。
滴滴出行的数据分析师王展伟表示,从用户处收集数据的信息公司对中国有益。他的团队计划利用打车数据来测算消费者支出,比如说追踪人们打车前往商场、电影院和KTV娱乐场所的频率。
“我们试图用数据来服务社会,” 王展伟表示,“如果中国能更了解人们的出行习惯,他们或许可以更好地进行城市规划。”
官员也在关注这一趋势。中国国家统计局新闻发言人盛来运表示,“我们欢迎大数据,也接受大数据,”统计局在某些指标中也纳入了大数据,如零售额、消费通胀和房价等指标。但他也说,非数据编制机构的统计方法应该更透明,这样才能获得可信度。
然而,处理、筛选和理解所有的新数据并不容易,即使是世界最大的对冲基金也难以在强大的干扰下分辨出正确的信号。
彭博行业研究(Bloomberg Intelligence)的经济学家欧乐鹰(Tom Orlik)和贾斯汀?希门尼斯(Justin Jimenez)在一份报告中比较了国家统计局和大数据公司的指标,他们发现,虽然这些新指标为解读中国经济提供了更加完整的另类视角,但这些指标大多还是在验证数据。
SpaceKnow公司编制的中国卫星制造业指数最近触及多年高位,和中国及非数据一致。
但一些新指标不符合数据。加利福尼亚州帕洛阿尔托的Orbital Insight公司在分析卫星图像后指出,中国石油储量可能高过预计。
“在我们完全认识其正确性前,在政策决定中使用这些方法是有风险的。”大学伯克利分校信息学院的助理教授乔舒亚?布鲁门斯多克(Joshua Blumenstock)表示。新指标不会取代数据,“但它们可以作为补充,提供额外的信息和背景,在没有数据的时候还能应急。”
对百度的吴海山来说,每天流入百度服务器的数亿数据点能让他通过用户的个人决策信息来更加细致地观测中国的经济趋势。
“我们现在触及的维度是之前难以企及的,”吴海山说,“观察人们作为经济动物的行为,一直都是很有意思的事。”
推荐: