实证资产定价——美股数据篇
这两天又在搞数据了,所以也算是为了让自己方便,在这里大概写一下实证资产定价中被用的最多的数据。研究美股市场用的最多的就是WRDS里面的CRSP数据库了,当然这个是需要买的,一般高校里面也基本都买了,自己找老师申请账号就可以登陆使用,非常方便。
首先讲讲CRSP样本中主要包含的交易所,在使用美股的数据时,通常会选择在这三个交易所内进行交易的股票,也就是NYSE,AMEX,以及NASDAQ。很多研究中会选择用Dec1925-至今的所有数据。回顾CRSP数据库发展史,在1925年12月,也就是我们所拥有历史数据的第一个月,当时CRSP样本中总共包含了499支股票,这些股票都是在NYSE上市的股票;从这个时间起直到1962年6月,股票的数目也在逐年增加(非单调递增)并增长到了1130支,其中有1121支来自NYSE,其余9支属于其他交易所;在1962年7月,这时CRSP样本中所包含的股票从1130一跃成为1963支,1125支NYSE,834支AMEX,4支其他;这个增长主要是因为在之前的CRSP中并未考虑在AMEX上市的股票,因为这个原因,也有研究中会选用从1963-至今的数据作为样本;同样的情况还发生在1972年12月,这个时间点NASDAQ数据也进入了CRSP数据库,在1972年11月时,CRSP包含2666支股票,其中1386支来自NYSE,1135支来自AMEX,102支来自NASDAQ,还有53支属于其他交易所;而在1972年12月,CRSP数据库中的股票数目上升至5534支,1386支NYSE,1135支AMEX,2896支NASDAQ,和117支其他。
在看过这些交易所里面股票数目的变化之后,我们换个维度,也就是通过市值的角度重新考虑前面提过的时间点。为了方便比较,在这里所说的所有数据都使用CPI进行了通胀调整。在1925年12月,CRSP中所有股票的市值是$341billion,在1962年,当样本中包含AMEX的数据之前,整个市场中所有在NYSE交易股票的市值为$2.15trillion,当加入AMEX的股票后,市值变为$2.45trillion,其中$2.30trillion来自在NYSE交易的股票,另外$145billion则来自AMEX的834支股票。虽然前面提到,股票的数目有所增长,但是市值的变化基本不大,同样NASDAQ的股票总市值所占份额也很低,所以大多数时间会选取全时间段的数据进行研究。但是时间段的选择主要还是根据自己的需求。
下面重点讲讲数据下载后常用的几个变量
ALTPRC:一般作为price的指标使用(注意使用ALTPRC而非PRC)
SHROUT:在外发行股份总数目(以1000为单位)
MktCap:abs(SHROUT*ALTPRC)/1000(以百万为单位)
EXCHCD:股票在哪个交易所交易
NYSE:1 or 31
AMEX:2 or 32
NASDAQ:3 or 33
RET:(Focal variable)月收益
SICCD:SIC code,0代表数据缺失
哎感觉自己写的乱七八糟的,先发出来明天再补充