重读概率论(2)
今天早上起来,读的是这本教材的第二章《条件概率与统计独立性》,很多熟悉的内容,但是却也有很多新的收获。
条件概率时bayes学派的基础,想来也是很靠谱的。但是bayes学派之所以受到频率学派的诟病,恐怕和先验概率多为主观所定的有很大关系。但是,从我个人的角度来讲,我更倾向于bayes学派的观点,即使没有任何先验的信息,我们依然可以将先验概率看成是均匀分布,这与人类的认知习惯是相符合的。也更加统计学。(这里统计学是个形容词)。
自从Sheldon在TBBT第一集中大喊“地质学不是真正的科学”以后,有很多人也在我面前大喊“统计学不是真正的科学”。其实真正的科学又是什么呢?数学?物理?化学?逻辑?哲学?我觉得都是人类认知世界的一种规范性的方式,都具有前提假设。统计学所研究的不确定性,在我看来,正是这个世界的本来面目。经常有人因为一些事情没有发生在自己身上,比如80%能中奖,但是自己却没有中奖而怀疑统计学,那其实是因为他并没有了解统计学所研究的事物的本质。
在我们上大二,学习概率论的时候,老师就告诉过我们,事物的统计学规律是在大量重复试验下才体现出来的。而到现在为止,我们依然因为那些看似大概率事件没有发生而不断怀疑着统计学本身。这一现象所体现的,其实是人类在解释事物时候往往倾向于有利于自己方面这样一个心理学规律。
这本书第二章引起我关注,并仔细阅读的部分是伯努利概型。从伯努利概型引出了几种常见的分布,包括伯努利分布,二项分布,几何分布,帕斯卡分布。对于各种分布,我在本科期间常常处于很迷糊的状态,到了硕士期间,因为遇到的大多数是正态分布,因此也没有专门去研究各种分布的情况。这其实是我的一大短板。下面我简单介绍一下由伯努利概型引出的这几种分布。
首先,伯努利概型,比如说我们所感兴趣的是试验中A是否会发生。我们重复n次试验,每次试验只有两个结果,A发生,A不发生。而且各次试验之间是相互独立的。这样的概型就叫做伯努利概型。
n=1的时候,也就是试验只有进行一次,这时候的概率分布情况就是所谓的伯努利分布,这是最简单的。
n次伯努利试验中出现k次A发生的情况的概率,服从的是二项分布。
n次试验,首次A出现发生在第k次试验的概率,服从的是几何分布。
n次试验,第r次A出现发生在第e次试验的概率服从的是所谓的帕斯卡分布。
帕斯卡分布很完备的解决了赌徒分赌注的问题。具体过程似乎可以参考陈希孺先生的《数理统计简史》(如果我没有记错的话)。当然这本教材中也比较具体介绍了一下赌徒分赌注的问题。
之后,这一章介绍了直线上的随机游动问题,基本上属于随机过程里面的基础的东西,但是具体推到的过程,还是比较有趣的,运用了差分方程与洛必达法则,所以说,学好数学分析还是蛮重要的。(可惜自己学得很烂)。
之后的部分,具体介绍了二项分布和泊松分布,这两个分布在模拟中经常用到。而且实际的应用中常常应用到这两个分布的极大似然估计,也是非常实用的。
条件概率时bayes学派的基础,想来也是很靠谱的。但是bayes学派之所以受到频率学派的诟病,恐怕和先验概率多为主观所定的有很大关系。但是,从我个人的角度来讲,我更倾向于bayes学派的观点,即使没有任何先验的信息,我们依然可以将先验概率看成是均匀分布,这与人类的认知习惯是相符合的。也更加统计学。(这里统计学是个形容词)。
自从Sheldon在TBBT第一集中大喊“地质学不是真正的科学”以后,有很多人也在我面前大喊“统计学不是真正的科学”。其实真正的科学又是什么呢?数学?物理?化学?逻辑?哲学?我觉得都是人类认知世界的一种规范性的方式,都具有前提假设。统计学所研究的不确定性,在我看来,正是这个世界的本来面目。经常有人因为一些事情没有发生在自己身上,比如80%能中奖,但是自己却没有中奖而怀疑统计学,那其实是因为他并没有了解统计学所研究的事物的本质。
在我们上大二,学习概率论的时候,老师就告诉过我们,事物的统计学规律是在大量重复试验下才体现出来的。而到现在为止,我们依然因为那些看似大概率事件没有发生而不断怀疑着统计学本身。这一现象所体现的,其实是人类在解释事物时候往往倾向于有利于自己方面这样一个心理学规律。
这本书第二章引起我关注,并仔细阅读的部分是伯努利概型。从伯努利概型引出了几种常见的分布,包括伯努利分布,二项分布,几何分布,帕斯卡分布。对于各种分布,我在本科期间常常处于很迷糊的状态,到了硕士期间,因为遇到的大多数是正态分布,因此也没有专门去研究各种分布的情况。这其实是我的一大短板。下面我简单介绍一下由伯努利概型引出的这几种分布。
首先,伯努利概型,比如说我们所感兴趣的是试验中A是否会发生。我们重复n次试验,每次试验只有两个结果,A发生,A不发生。而且各次试验之间是相互独立的。这样的概型就叫做伯努利概型。
n=1的时候,也就是试验只有进行一次,这时候的概率分布情况就是所谓的伯努利分布,这是最简单的。
n次伯努利试验中出现k次A发生的情况的概率,服从的是二项分布。
n次试验,首次A出现发生在第k次试验的概率,服从的是几何分布。
n次试验,第r次A出现发生在第e次试验的概率服从的是所谓的帕斯卡分布。
帕斯卡分布很完备的解决了赌徒分赌注的问题。具体过程似乎可以参考陈希孺先生的《数理统计简史》(如果我没有记错的话)。当然这本教材中也比较具体介绍了一下赌徒分赌注的问题。
之后,这一章介绍了直线上的随机游动问题,基本上属于随机过程里面的基础的东西,但是具体推到的过程,还是比较有趣的,运用了差分方程与洛必达法则,所以说,学好数学分析还是蛮重要的。(可惜自己学得很烂)。
之后的部分,具体介绍了二项分布和泊松分布,这两个分布在模拟中经常用到。而且实际的应用中常常应用到这两个分布的极大似然估计,也是非常实用的。