1.5 一门丰富的社会科学01
来自:Ibizaza
大部分现有的社会科学要么基于实验室里的现象分析,要么基于调查分析——那就是说,都是对某一平均值或某一种固定模型的描述。这些方法都不能解释复杂的真实生活,因为我们所有人的精神世界在不同的时间都是不同的状态。同时,这些方法也忽略了许多人们在社会行为中的关键细节,比如人们交往的对象,交往的方式,对市场力量或政治结构产生的影响。社会现象是由许许多多个体之间的交互细节组成的——人们不仅仅交易实物和金钱,还有信息、创意,或只是八卦。这些个体之间的交互背后有一个对社会产生影响的模式,会驱动比如金融危机和“阿拉伯之春”之类的社会现象。我们需要了解这些微型模式,因为它们不能简单地平均化代表传统的认知社会方式。通过成千上万的点对点交互网络,大数据给我们提供了一个从宏观层面观察完整、复杂社会的视角。

图形1:社会科学观察和实验的定性概况图,横轴代表数据收集的持续时长,纵轴代表信息收集的丰富程度。数据包括:(1)大部分的社会科学实验,(2)中西田野研究站(Midwest Field Station)Ⅰ,(3)弗明汉心脏病研究(Framingham Heart Study)Ⅱ,(4)通话记录大数据(Large Call Record data sets)Ⅲ,(5)现实挖掘Ⅳ,(6)社会进化Ⅴ,(7)朋友和家人Ⅵ,(8)社交测量传感器研究(Sociometric Badge studies)Ⅶ,(9)发展数据(D4D)数据设备Ⅷ,(10)未来的世界。 Ⅰ:Barker1968. Ⅱ:Dawber1980. Ⅲ:Gonzalez et al.2008;Eagle et al.2010; Hidalgo and Rodriquez-Sickert2008. Ⅳ:Eagel and Pentland2006. Ⅴ:Madan et al.2012. Ⅵ:Aharony et al.2011 Ⅶ:Pentland2012b. Ⅷ:http://www.d4d.orange.com/home. 如果我们有一双全景视角的“上帝之眼”,或许我们就能真正地读懂人类社会的动作原理,解决我们的问题。不幸的是,就如图形1中的说明,传统社会科学(标签1)中的数据之和十分接近(0,0)坐标点,这意味着这些数据代表的信息来源于不到100人的少量人群,并且采集的时间只有几个小时。标签2和3是一些大型的社会科学数据研究机构(注11)。在过去的10年里,计算社会学家已经开始学会掌握如何利用大数据和收集数据来源,比如通过数据采集设备从移动电话公司和社交公司收集数据。标签4就是一个典型的类似研究案例。不幸的是,这些大型的数据设备还是不够用,因为它们一次只能采集的变量还是很小。因此,它们只能提供的人性观察非常有限。 社会物理学家尝试最大的努力来寻找最丰富的定量描述。标签5、6、7的数据来自我自己的研究团队,是通过智能手机来采集数据的;标签8的研究使用了智能的电子设备——传感器,或者叫“sociometers(一种可穿戴的智能传感器)”,来收集数据(详情见现实挖掘附录);标签9是“发展数据(D4D)”数据采集设备,覆盖了整个科特迪瓦共和国的人口。 只需要简略地看一下图形1,很容易可以看出这些社会物理学数据机构的数据量级比传统社会科学要丰富得多。这些大型数据机构背后是巨大的、客观的、持续性的、密集的数据,让我们可以建立一个定量预测人类复杂日常行为的模型。 重要的是,标签10代表了世界未来的方向。在未来短短的几年时间里,我们可以完成惊人的全人类行为数据收集——并保持数据的持续性。数据本身已经存在于电话网络中,信用卡数据库中,和各种其它的地方,但目前只有技术专家可以看得到。现在这些数据越多广泛地应用于科学调研中来,但社会物理学这门新科学会推进更一步发展的势头。一旦我们发明了一个更精准的人类生活模型,我们有希望能理解并掌控我们的现代社会,驾驭我们人类和技术之间复杂的、相互接连的网络。 为了支持这本书,我在网上列出了几个世界上最大的、最详细的生活实验室数据机构。这些新的虚拟信息来源使得我们可以准确测量出人与人之间、人与商业之间的交互模式,以及描绘人们在日常生活中的行为模式图谱。这些生活实验室数据机构包括: 朋友和家人:收集了来自一批年轻家庭大约18个月的数据,涵盖了各种社交层面的变量指标,包括地理位置、近物记录、沟通行为、购买数据、社交媒体使用行为、手机APP和睡眠数据(注12)。我们每隔6分钟会测量30个行为变量(注13)。这项研究包含了总量达150万个小时的针对人类社会行为的定量观察数据。 社会进化:来自高校宿舍9个月的数据,含有每隔5分钟测量一次的地理位置、近物记录和沟通信息,另外单独测量的健康指标、政治行为和社交变量(注14)。这项目研究包含了总量50万个小时的定量观察数据。 现实挖掘:来自毕业学生和两所大学实验室的9个月数据,含有每5分钟测量一次的地理位置、近物记录和电话使用记录,还包含一些其它的社交行为(注15)。这荐研究涵盖了超过33万个小时的人类交互数据。 传感器数据收集:来自白领办公场所的1个月数据,包括每16毫秒测量一次的地理位置、信息交流和肢体语言,还有精确的工作流和工作任务测量(注16)。 分析数据,分析图形,代码,文档和论文都可以在下面的网址中找到:http://realitycommons.media.mit.edu.这些数据全部获得美国联邦人类调查法的保护(注17)。
最新讨论 ( 更多 )
- 回顾相对论的研究历史 (珊珊)
- 怎样教好大学物理? (珊珊)
- 有没有玩音乐的? (Ibizaza)
- 致谢 (Ibizaza)
- 9.2 城市的社会物理学 (Ibizaza)