传媒扫描
中国科学报:严加安:日常生活中的概率统计
发布时间:2012-06-08

作者:严加安  来源于:《中国科学报》 发表时间:2012-06-08 

今年3月3日《中国科学报》“新知”专栏发表了我的一篇科普文章《概率破玄机,统计解迷离》。本文是该文的续篇。文章通过若干例子,进一步说明概率统计在我们日常生活中的作用。

“生日悖论”

n个人中至少有两人生日相同的概率是多少?这是有名的“生日问题”。令人难以置信的是:随机选取的23人中至少两人生日相同的概率居然超过50%,50人中至少两人生日相同的概率居然达到97%!例如,假定一个中学有20个班,每个班平均有50个学生,你可以调查一下,大概有十几个班都有至少两个相同生日的学生。这和人们的直觉是抵触的。因此这一结果被称为“生日悖论”。

其实,有关概率的计算很简单。首先计算50个人生日都不相同的概率。第一个人的生日有365个可能性,第二个人如果生日与第一个人不同,他的生日有364个可能性,依次类推,直到第50个人的生日与前面49个人都不同,有316个可能性,所以50人生日都不同的可能组合方式就是365乘364乘363一直乘到316,但由于每个人的生日是独立的,总的可能组合是365的50次方,这样一来,50个人生日都不相同的概率就等于两个组合数之比,这个概率非常小,约等于3%,至少两个人生日相同的概率约等于1减去3%,约等于97%,这样概率就计算出来了。

注意:如果预先选定一个生日,随机选取125人、250人、500人,出现某人生日正好是选定生日的概率分别大约只有30%、50%、75%,比想象的小得多。

如何理解社会和大自然中出现的奇迹

对单个彩民和单次抽奖来说,中乐透头奖的概率大概是2250万分之一。“纽约乐透”每周三和周六晚间各开奖一次,每年开奖104次,40年间经历约4100次开奖。通常以前中过“纽约乐透”头奖的人还经常买“纽约乐透”彩票,而且每次下的注数都比较大。到2008年,在“纽约乐透”40年中,出现过3次一人中过两次头奖。这一事件发生的概率并不是非常小。

在河北省著名旅游景点野三坡的蚂蚁岭左侧,断崖边缘有一块直径10米、高4米的“风动石”,此石着地面积不足覆盖面积的1/20,尤其基部接触处只有两个支点。这也算是一个奇迹。大自然中的奇迹是地壳在亿万年的变迁中偶然发生的,但这种奇迹在历史的长河中最终出现是一种必然现象。正如我在《科学诗:随机与概率》中所言:“情境重复催生稀有事件,历史长河沉淀自然奇迹。”

“竞赛规则”藏玄机

假定有甲、乙两个乒乓球运动员参加比赛,已知甲的实力强于乙。现有两个备选的竞赛规则:“3局2胜制”,或“5局3胜制”。试问:哪一种竞赛规则对甲有利?

 

分组混合血标本检验既省钱又省时

某医院对一群人进行一项关于艾滋病的抗-HIV1/2检验。如果对每个人的血标本单独检验,既费时,成本又高。如果采用“分组混合血标本检验”,可以节省成本和时间。具体做法如下:假定采集到N个血标本,把每个血标本平分成两份,一份留做备用。另一份平均分成M组,将每组的血标本混合在一起进行一次性检验。如果发现某组检测为阳性,再用该组相关人的备用血标本进行逐个检验,筛查出艾滋病患者。

 

“统计平均”的陷阱

我们曾在《概率破玄机,统计解迷离》一文中举例说明“统计平均”存在陷阱,下面再举一个例子说明这一点。

假定某大学数学系有教授15人、副教授40人、讲师和助教25人,这三类人的平均年收入分别是15万、12万、8万,该单位职工平均年收入为10万。又假定科学院某研究所有研究员60人、副研究员30人、助研30人,这三类人的平均年收入分别是14万、11万、7万,但该研究所职工平均年收入为11.5万,高出那个系职工平均年收入1.5万。这一例子表明:由于各单位人员构成比例不同,单位职工平均年收入这一指标不能真实反映单位职工的收入状况。

这一例子给了我们一些启示:有些新闻报道中的统计平均数字没有实际意义。例如,2010年2月国家统计局公布称,2009年我国70个大中城市房价同比上涨1.5%,这与大城市居民的实际感受完全背离,被网友戏称为“房价被拉低”。接受这次教训,国家统计局于2011年2月16日正式宣布,今后将不再发布全国70个城市房价涨幅平均数,理由是“平均数在个体差异较大的情况下,往往会削峰填谷,抹平个体间的差异。”这是一个明智的决定。


附件下载: