大数据时代
当我受邀为商学院的同学们写一篇书评时,我就在思考,什么样的书适合商学院的学子来阅读,实用又不失乐趣。于是我的目光就落在了书架上的《大数据时代》这本书上。
为何我觉得这本书是商学院学子必读的一本书呢?毫无疑问,因为重要!其一,我们总能听到说,我们的时代是一个变化的时代,需要创新的时代,那么究竟什么在变化,什么在创新呢?这本书就能给你一个想法。其二,大数据对于商业圈子的冲击如此之大,以至于究竟谁最先掌握了大数据的技术和能力,谁就能引领这个行业的创新和转型。对于大多数商学院学子而言,不知大数据为何物,更不知道其为何重要,在商场拼搏而言,注定少了一注必胜的筹码。已经有人断言,在未来,大数据决定企业的竞争力。其三,大数据和我们的金融、会计专业息息相关,不论学术还是实业界,都将受其重大影响,甚至将转变全部的思维方式。金融分析行业尤其重要,倘若你对金融分析的幻想还是坐在电脑前,看着K线图,摸着下巴,用所谓的经验和直觉来选股投资,你就等着被高端的大数据分析技术惨虐吧,这可不是你的小脑袋瓜就能跟上的。世界最领先的金融和银行业都已经在用大数据引领整个行业的转型,而你还捧着一本山寨的《一把手教你学会炒股》吗?
这本书有什么样的特点呢?首先,通俗易懂,我相信对于绝大多数商学院学生来说,都是非常容易接受和吸收的(个别注意力不集中,没有很多彩色插图就读不完一本书,并且认定“读书无用论”的人除外)。其次,建构较为完整,基本上勾画出了大数据所需要知道的概念、特点、发展方向,对于初步接触和了解大数据的人,已经达到了基本扫盲的要求了。最后,太过通俗易懂了,专业性依旧不够强,毕竟只是一本畅销书,如果对于读书只停留在这个层面是远远不够的。想深入了解更多,可以查看附录推荐书目,或者打开谷歌学术,搜索big data,查看最新学术成果。如果你只是想简单了解,该书足以。
一. 什么是大数据?
先从一个例子来感受一下,大数据的魅力吧。在甲型H1N1流感爆发之前的几周,谷歌公司的工程师们在《自然》杂志上发表了一篇令人瞩目的论文。它令公共卫生官员和计算机科学家们感到震惊。文中解释了谷歌为什么能够预测动机流感的传播:不仅是全美的传播,还能具体到特定的地区和州。谷歌保存了多年来的搜索记录,而且每天都会受到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。
谷歌通过相关的检索词条,例如“哪儿些是治疗咳嗽和发热的药物”,总共处理了4.5亿个数学模型,将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现了45条检索词条的组合,用于某个特定的数学模型后,他们的预测与官方数据相关性高达97%。他们可以预测出流感从哪儿里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发后一两周才能感知到。这是大数据非常精彩的一个案例!
从以上可以看出,大数据首先确实给人一个“数据大”的印象,但是这并不足以指明大数据的定义。在作者舍恩伯格看来,大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织结构,以及政府与公民的关系的办法。
大数据需要处理的信息量过大,已经超过了一般电脑在处理数据时所能使用的内存量。所以人们改进了信息处理技术,例如谷歌的MapReduce 和开发源Hadhoop平台。更重要的是,这些数据不再需要传统的数据库表格来整齐排列——一些可以消除僵化层次结构和一致性的技术也出现了。
二. 大数据有哪儿些特点?
(1)大数据的特点之一——全体数据取代抽样数据
抽样统计的盛行,一度极大地方便了社会的发展,在我们如今的生活中,依旧是主流。当你学习《统计学》时,你依旧会主要学习到以抽样统计为基础的统计学理论,如参数估计等等。对于全体抽样,书上一般只有简单的一句话,这是最理想的模式,但是成本太大,一般不予采用。
舍恩伯格认为,随机采样确实有其巨大的作用,但是它只是一种捷径,有着固有缺陷和局限性,是人类技术尚未足够发达的无奈之举。在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机抽样应运而生,它也可以被视为那个时代的产物。而如今,计算和制表不再像过去那么困难。感应器、手机导航、网站点击和twitter被动地手机了大量的数据,而计算机可以轻易地对这些数据进行处理。
随机抽样的目的就是用最少的数据得到最多的信息。当我们可以获得海量的数据的时候,它就没有什么意义了。数据处理技术已经发生了翻天覆地的改变,但我们的方法和思维却没有跟上这种变化。在某些情况下,我们依旧会使用样本分析法,但是随着时代的发展,慢慢的,我们会完全抛弃样本分析。
(2)大数据的特点之二——混杂性代替精确性
对于抽样时代而言,小数据最基本、最重要的要求就是减少错误,保证质量。因为收集的信息比较少,所以我们必须确保记录下来的数据尽量准确。因为收集信息的有限性意味着细微的错误会被放大,甚至可能影响到整个结果的精确性。
然而,在现如今的时代里,允许不精确已经成为了一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,利用这些大数据,可以做只用小数据是永远无法做到的事情。
传统的样本分析师难以接受错误数据的存在,因为他们一生都在研究如何防止和避免错误的出现。而大数据时代则要求我们重新审视精确性的优劣。如果固执于传统的思维模式,将使我们错过最重要的信息。我们不再需要那么担心某个数据点对整套分析的不利影响,我们要做的就是接受这些纷繁的数据,并从中收益,而不是以昂贵的代价消除所有的不确定性。
(3)大数据的特点之三——相关关系取代因果关系
沃尔玛通过大数据发现,每次飓风来临之前,蛋挞的销量都会大增,于是他们就将蛋挞放在飓风产品旁边销售。当你看到这的时候,你一定又试图需找因果关系:因为飓风来袭,人们需要存储食物,所以蛋挞销量会大增。且慢,你又陷入了传统且局限的思维中了,总是会试图用因果关系解释各种事物间的联系,并且你的这些猜想很可能都是错的,例如为什么一定会是蛋挞,而不是方便面呢?然而,大数据正是反其道而行之,抛弃一切因果关系的陈旧的思维方式,而寻找新的思维方式——只问“是什么”,不问“为什么”。
当我们只问是什么,而不问为什么的时候,我们抛弃了从前固有的偏见,重新认识了这个世界,发现了许多以前不曾发现的规律。例如,橙色车子发生故障的概率是其他颜色的一半,天冷穿的少并不导致感冒机会的增加,手机的使用和癌症的发作没有任何关系。
我们太过依赖凭借直觉而来的因果关系,反而没有帮助我们加深对这个世界的理解。而大数据的兴起,使我们不再受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。
三. 大数据与金融、会计的关系
(1)大数据时代下,平庸的金融公司和证券分析师的消亡
大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关系转化而释放出来的潜在的价值态度,正是主宰这场游戏的关键。新型的技术工具的使用使这一切成为可能。美国第一资本银行率先将大数据运用在银行业,因此改变了整个行业。
在过去的时代,由于数据的不足,人们需要通过经验和直觉来弥补这个的缺憾。而在大数据时代,平庸的基金公司和证券分析师还在试图利用经验和直觉这样的陈旧的思维方式来决定投资,关注于每个股票背后的因果和故事。已经有越来越多的金融公司和分析师,不再相信经验和直觉,而是利用数据和模型,由电脑做出交易决策。
全球最大的对冲基金Bridge Water就是最好的例子,他们搜集了近百年的金融数据建立交易模型,覆盖全球外汇,债券,衍生品和股票市场,其99%的交易都由电脑决策作出。不远的将来,普通的共同基金将被根据大数据分析提供交易策略的公司所取代,留下的基金公司将是那些能够提供独特优势的对冲基金和自营基金。
(2)大数据时代下,会计体系的改革
会计伴随着工业革命的诞生,可以说是促进资本主义发展的一大重要因素。人类开始记录数据,用数据来反映公司的价值。然而,我们如今的会计体系,很大程度上是旧工业时代的遗产,甚至已经被频频质疑其实用性和落后性。最典型的一个例子就是账目价值和市场价值的严重失调。Facebook公司的账面价值只有66亿美元,但是其市场价值已经高达一千亿美元,中间差额达几百倍。在作者舍恩伯格看来,其原因就在于会计体系没有足够重视无形资产的价值。而在未来的时代中,数据甚至将成为一家公司的决定性优势,成为最大的资产,而会计系统若无创新改革,将失去其意义和作用。
(3)《大数据时代》给我们的警示和思考
在大学里,很多同学只专注于课本的学习和专业知识的记忆,却忽略了对思维的培养和创新的能力(其实真相是很多人连课本都没学好,哈哈)。而在中国的大学,教育更多只强调基础的理论和课本的知识,甚至陈旧而有些脱离现实。倘若只满足于这个层次,恐怕未来的竞争会少了很多的筹码。而在如今的时代,倘若没有对时代变革敏锐的嗅觉,完整而灵活的思维方式,自我学习能力的培养,到社会上,终究是个落后者。
在学好基础课程的同时,不要只满足于考试的内容,要极大地丰富自己的视野,开拓思维,而读书就是最好的方式。《大数据时代》只是众多好书中的一本,这本书告诉你了什么是落后的思维,什么是创新的思维,这个世界正在发生什么样的改变,未来的趋势会是什么样的。我把这本书带给你们,希望让你们发现读书之乐趣,也带给你们新鲜的思考和认知。
为何我觉得这本书是商学院学子必读的一本书呢?毫无疑问,因为重要!其一,我们总能听到说,我们的时代是一个变化的时代,需要创新的时代,那么究竟什么在变化,什么在创新呢?这本书就能给你一个想法。其二,大数据对于商业圈子的冲击如此之大,以至于究竟谁最先掌握了大数据的技术和能力,谁就能引领这个行业的创新和转型。对于大多数商学院学子而言,不知大数据为何物,更不知道其为何重要,在商场拼搏而言,注定少了一注必胜的筹码。已经有人断言,在未来,大数据决定企业的竞争力。其三,大数据和我们的金融、会计专业息息相关,不论学术还是实业界,都将受其重大影响,甚至将转变全部的思维方式。金融分析行业尤其重要,倘若你对金融分析的幻想还是坐在电脑前,看着K线图,摸着下巴,用所谓的经验和直觉来选股投资,你就等着被高端的大数据分析技术惨虐吧,这可不是你的小脑袋瓜就能跟上的。世界最领先的金融和银行业都已经在用大数据引领整个行业的转型,而你还捧着一本山寨的《一把手教你学会炒股》吗?
这本书有什么样的特点呢?首先,通俗易懂,我相信对于绝大多数商学院学生来说,都是非常容易接受和吸收的(个别注意力不集中,没有很多彩色插图就读不完一本书,并且认定“读书无用论”的人除外)。其次,建构较为完整,基本上勾画出了大数据所需要知道的概念、特点、发展方向,对于初步接触和了解大数据的人,已经达到了基本扫盲的要求了。最后,太过通俗易懂了,专业性依旧不够强,毕竟只是一本畅销书,如果对于读书只停留在这个层面是远远不够的。想深入了解更多,可以查看附录推荐书目,或者打开谷歌学术,搜索big data,查看最新学术成果。如果你只是想简单了解,该书足以。
一. 什么是大数据?
先从一个例子来感受一下,大数据的魅力吧。在甲型H1N1流感爆发之前的几周,谷歌公司的工程师们在《自然》杂志上发表了一篇令人瞩目的论文。它令公共卫生官员和计算机科学家们感到震惊。文中解释了谷歌为什么能够预测动机流感的传播:不仅是全美的传播,还能具体到特定的地区和州。谷歌保存了多年来的搜索记录,而且每天都会受到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。
谷歌通过相关的检索词条,例如“哪儿些是治疗咳嗽和发热的药物”,总共处理了4.5亿个数学模型,将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现了45条检索词条的组合,用于某个特定的数学模型后,他们的预测与官方数据相关性高达97%。他们可以预测出流感从哪儿里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发后一两周才能感知到。这是大数据非常精彩的一个案例!
从以上可以看出,大数据首先确实给人一个“数据大”的印象,但是这并不足以指明大数据的定义。在作者舍恩伯格看来,大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织结构,以及政府与公民的关系的办法。
大数据需要处理的信息量过大,已经超过了一般电脑在处理数据时所能使用的内存量。所以人们改进了信息处理技术,例如谷歌的MapReduce 和开发源Hadhoop平台。更重要的是,这些数据不再需要传统的数据库表格来整齐排列——一些可以消除僵化层次结构和一致性的技术也出现了。
二. 大数据有哪儿些特点?
(1)大数据的特点之一——全体数据取代抽样数据
抽样统计的盛行,一度极大地方便了社会的发展,在我们如今的生活中,依旧是主流。当你学习《统计学》时,你依旧会主要学习到以抽样统计为基础的统计学理论,如参数估计等等。对于全体抽样,书上一般只有简单的一句话,这是最理想的模式,但是成本太大,一般不予采用。
舍恩伯格认为,随机采样确实有其巨大的作用,但是它只是一种捷径,有着固有缺陷和局限性,是人类技术尚未足够发达的无奈之举。在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机抽样应运而生,它也可以被视为那个时代的产物。而如今,计算和制表不再像过去那么困难。感应器、手机导航、网站点击和twitter被动地手机了大量的数据,而计算机可以轻易地对这些数据进行处理。
随机抽样的目的就是用最少的数据得到最多的信息。当我们可以获得海量的数据的时候,它就没有什么意义了。数据处理技术已经发生了翻天覆地的改变,但我们的方法和思维却没有跟上这种变化。在某些情况下,我们依旧会使用样本分析法,但是随着时代的发展,慢慢的,我们会完全抛弃样本分析。
(2)大数据的特点之二——混杂性代替精确性
对于抽样时代而言,小数据最基本、最重要的要求就是减少错误,保证质量。因为收集的信息比较少,所以我们必须确保记录下来的数据尽量准确。因为收集信息的有限性意味着细微的错误会被放大,甚至可能影响到整个结果的精确性。
然而,在现如今的时代里,允许不精确已经成为了一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,利用这些大数据,可以做只用小数据是永远无法做到的事情。
传统的样本分析师难以接受错误数据的存在,因为他们一生都在研究如何防止和避免错误的出现。而大数据时代则要求我们重新审视精确性的优劣。如果固执于传统的思维模式,将使我们错过最重要的信息。我们不再需要那么担心某个数据点对整套分析的不利影响,我们要做的就是接受这些纷繁的数据,并从中收益,而不是以昂贵的代价消除所有的不确定性。
(3)大数据的特点之三——相关关系取代因果关系
沃尔玛通过大数据发现,每次飓风来临之前,蛋挞的销量都会大增,于是他们就将蛋挞放在飓风产品旁边销售。当你看到这的时候,你一定又试图需找因果关系:因为飓风来袭,人们需要存储食物,所以蛋挞销量会大增。且慢,你又陷入了传统且局限的思维中了,总是会试图用因果关系解释各种事物间的联系,并且你的这些猜想很可能都是错的,例如为什么一定会是蛋挞,而不是方便面呢?然而,大数据正是反其道而行之,抛弃一切因果关系的陈旧的思维方式,而寻找新的思维方式——只问“是什么”,不问“为什么”。
当我们只问是什么,而不问为什么的时候,我们抛弃了从前固有的偏见,重新认识了这个世界,发现了许多以前不曾发现的规律。例如,橙色车子发生故障的概率是其他颜色的一半,天冷穿的少并不导致感冒机会的增加,手机的使用和癌症的发作没有任何关系。
我们太过依赖凭借直觉而来的因果关系,反而没有帮助我们加深对这个世界的理解。而大数据的兴起,使我们不再受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。
三. 大数据与金融、会计的关系
(1)大数据时代下,平庸的金融公司和证券分析师的消亡
大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关系转化而释放出来的潜在的价值态度,正是主宰这场游戏的关键。新型的技术工具的使用使这一切成为可能。美国第一资本银行率先将大数据运用在银行业,因此改变了整个行业。
在过去的时代,由于数据的不足,人们需要通过经验和直觉来弥补这个的缺憾。而在大数据时代,平庸的基金公司和证券分析师还在试图利用经验和直觉这样的陈旧的思维方式来决定投资,关注于每个股票背后的因果和故事。已经有越来越多的金融公司和分析师,不再相信经验和直觉,而是利用数据和模型,由电脑做出交易决策。
全球最大的对冲基金Bridge Water就是最好的例子,他们搜集了近百年的金融数据建立交易模型,覆盖全球外汇,债券,衍生品和股票市场,其99%的交易都由电脑决策作出。不远的将来,普通的共同基金将被根据大数据分析提供交易策略的公司所取代,留下的基金公司将是那些能够提供独特优势的对冲基金和自营基金。
(2)大数据时代下,会计体系的改革
会计伴随着工业革命的诞生,可以说是促进资本主义发展的一大重要因素。人类开始记录数据,用数据来反映公司的价值。然而,我们如今的会计体系,很大程度上是旧工业时代的遗产,甚至已经被频频质疑其实用性和落后性。最典型的一个例子就是账目价值和市场价值的严重失调。Facebook公司的账面价值只有66亿美元,但是其市场价值已经高达一千亿美元,中间差额达几百倍。在作者舍恩伯格看来,其原因就在于会计体系没有足够重视无形资产的价值。而在未来的时代中,数据甚至将成为一家公司的决定性优势,成为最大的资产,而会计系统若无创新改革,将失去其意义和作用。
(3)《大数据时代》给我们的警示和思考
在大学里,很多同学只专注于课本的学习和专业知识的记忆,却忽略了对思维的培养和创新的能力(其实真相是很多人连课本都没学好,哈哈)。而在中国的大学,教育更多只强调基础的理论和课本的知识,甚至陈旧而有些脱离现实。倘若只满足于这个层次,恐怕未来的竞争会少了很多的筹码。而在如今的时代,倘若没有对时代变革敏锐的嗅觉,完整而灵活的思维方式,自我学习能力的培养,到社会上,终究是个落后者。
在学好基础课程的同时,不要只满足于考试的内容,要极大地丰富自己的视野,开拓思维,而读书就是最好的方式。《大数据时代》只是众多好书中的一本,这本书告诉你了什么是落后的思维,什么是创新的思维,这个世界正在发生什么样的改变,未来的趋势会是什么样的。我把这本书带给你们,希望让你们发现读书之乐趣,也带给你们新鲜的思考和认知。
还没人转发这篇日记