新冠时期的经济数据
最近看了好些文章, 都是讨论新冠疫情的经济影响。 发现一个趋势是越来越多的大牌经济学家都开始使用商业性的数据, 很多都是从互联网公司买来的。
美国权威的经济数据, 都是来自政府。 虽然没有国家统计局这样的机构, 但联邦政府各大部门都负责收集相关数据,并定时公布。比如劳动部下属劳动统计局负责劳动市场的数剧, 包括失业率,就业人数等。 商业部下面的经济分析局负责零售, 进出口,和国内总产值的统计。农业部,司法部, 教育部, 顾名思义,收集农产品,犯罪率, 学校人数,毕业率等相关数据。就是在新冠期间名声不好的疾病控制中心(CDC),也是健康方面的信息中心, 每年出生,死亡人数, 各种疾病情况,都由这个机构掌管。
因此很多关于宏观和区域经济研究的文章, 都是尽量采用政府数据。 一来历史长, 而且质量有保证。 美国人口统计已搞了两百多年, 是写在宪法里的。 就是失业率,国内总产值等数据,也是从四十年代就有了,一直没断过。 而且每次统计方法改进,政府的经济学家还会将历史数据用新方法重新估算一下, 所以用这些大家都认可的数据,审稿时也一般编辑,审稿人也不会对此百般提问。当然研究微观问题, 主要还是统过问卷调查,试验等方式获得数据。
自从互联网,“大数据”时髦起来,尽管有人采用一些网站的数据写文章, 但我的理解是它们的应用是比较有限的, 而且都是重点研究“数字经济”(digital economy)的, 关于总体经济的比较少。原因很多了。就拿申请工作的网站来说,现在大家都上网找工作, 按理说这些网站的信息应该有用, 但真正用起来很多问题。比如象建筑工人这些职业, 他们很少上网找工作, 那网站的数据就有偏差, 不能涵扩整个市场。 而且不同网站的简历,招工广告,如果汇总起来,肯定有很多重复的, 如何去重(de-duplication)也要花很多精力。更重要的是这些商业数据, 那天网站不流行了, 做不下去关门了, 所有数据也没有连续性,因为好的数据要一年一年积累。所以很多年来大家还是以政府数据作为标准。
但新冠疫情期间,政府数据的一大弱点就被放大了, 那就是更新太慢。 大部分的数据都是一月发布一次, 有的, 比如国内生产总值, 一个季度才发布一次, 而且有一两个月的滞后。 在经济正常平稳扩张时期,这些都不是大问题。 但在新冠爆发时, 每天都有大量突发事件发生, 股市大跌,禁止旅行,“居家令” 实施, 商家关闭,重新开门。大家都想随时来了解经济怎样变化。这时政府数据就跟不上形势了。所以最近我看到的很多研究新冠经济的文章, 无一例外都利用“高频率”“实时”的商业或网络数据, 有的是每天更新。比如用网上就业广告来看劳动需求, 用预订饭店/民宿网站的数据来研究商业破产情况, 用信用卡公司数据来看消费趋势。尽管商业数据的缺点还有很多, 但经济学家也是有点饥不择食了。况且目前的主要任务是去了解短期内的经济趋势,这些数据还是有用的。

和以前不同的是,我发现现在用这些数据的有好些些是哈佛和 芝加哥这些顶尖大学的教授。 他们的一些文章目前还都是以草稿的形式传阅。可以预见如果经过同行审稿的过程, 把网络数据的缺陷有好的解决方法, 最终能发表在影响力高的期刊上,那以前诟病很多的商业网络数据就登上大雅之堂了。