主观概率
(《新发现》专栏,勿转)
我们知道,一个科学理论从来不能完全被证明,但却可以被证伪。这是基于这个事实,即一个理论的预言可以有无限多,我们不可能一一去证实,但一个理论的预言可能被某个实验否定从而被证伪。例如,太阳明天照常升起,谁都不会怀疑,这就是基于以往我们的经验,或者基于牛顿力学的正确性。但是,我们却永远不能证明太阳明天照常升起,原因是我们不能逻辑地排除经验和理论中出现的偶然漏洞。
近年来,贝叶斯统计在宇宙学中甚至在理论物理中的应用越来越多,就是和上面的那个事实有关。人们常说,贝叶斯统计是一个主观概率理论,用以区别我们在大学学习的学术上称之为或然概率理论。在通常或然概率论中,一个事件发生的概率的含义是,假如你重复做无数次实验,那么该事件发生的次数与实验次数之比就是这个概率。而贝叶斯理论中的概率不是这样的,在贝叶斯理论中,一个事件发生的概率是我们的主观期待这个事件发生的可能性。比如,明天太阳照常升起的贝叶斯概率应该为1。主观上,我们说明天太阳照常升起是基于我们过去的经验,尽管这些经验是有限的。从这个例子我们知道,如果经验发生变化,那么贝叶斯概率也将发生变化,换言之,贝叶斯概率是基于有限的数据得出的数字,这个数字随着数据的增多会不断改善。
虽然我们不能证明一个理论,我们对一个理论的信心会随证据的增加变得越来越强。在我研究的领域,我们经常看到试图用增加理论复杂的办法来修改一个简单的理论,虽然没有任何证据说明那个简单的理论有任何问题。例如,总有人不断地发明新理论来代替爱因斯坦弯曲时空的引力理论,这些新理论越来越复杂,却在实验中找不到一点证据。提出这些新理论并非真的是怀疑爱因斯坦的理论,在我看来,基于贝叶斯推理,其实是证明爱因斯坦理论正确性的贝叶斯概率越来越大。
在传统概率论中,一个理论正确的几率只能取两个值,0或者1,要么完全是错误的,要么是正确的。但在贝叶斯理论中,一个理论的正确概率可以是0到1之间的任何一个数。我们人类能够做的实验和收集到的实验数据总是有限的,所以,就有了在有了一定数据的前提下,某个理论的正确的概率。更加具体地,令数据集合为D,理论为T,我们要做出在D的前提下T多大可能是正确的判断,这个概率记为。这是一个普通的条件概率,但计算起来并不容易。
当数据积累得越来越多后,我们可以利用贝叶斯定理来重新计算新的概率,这个概率会越来越大,如果数据倾向于支持理论。贝叶斯对所谓的贝叶斯统计的主要贡献是贝叶斯定理。在介绍贝叶斯定理之前,我们说一下最近为什么贝叶斯统计在宇宙学中变得重要。
在现代物理学中,决定论一直占上风,也就是说,一旦我们知道一个系统(例如整个宇宙)在某一个时刻的状态,我们就可以预言它在今后任何一个时刻的状态,反过来也可以倒推过去任何一个时刻的状态。宇宙学遇到最大的问题之一,很类似牛顿当年遇到的第一推动问题,就是,在宇宙大爆炸的最初一瞬,宇宙的状态到底是什么?这就是所谓初始条件问题。现代理论宇宙学的一些重要进展几乎都和这个第一推动问题相关。例如,为了解释宇宙的均匀性,Guth发明了暴涨宇宙论。另一个与初始条件相关的问题是,宇宙中这么多的丰富内容是怎么来的?也就是说,为什么宇宙在最初的时刻比现在要简单得多?
有一种可能,是宇宙的初始条件并不是唯一的,而是任何可能性都出现过,这就是多元宇宙论。与多元宇宙相关的是,弦理论中允许不同种类的宇宙出现,其中物理定律可以不同。这样,我们就有了如何判断我们看到的这个宇宙的概率问题,以及,弦理论中不同规律(或理论)成立的概率问题。如前,令D代表我们收集到的宇宙学观测数据,T代表弦理论中的某个理论(或规律)或多元宇宙中的某个宇宙,我们需要计算在数据D前提下T成立的概率。
在贝叶斯推理中,我们将D和T都看成是“事件”,那么是在事件D发生的前提下,事件T发生的概率。现在,贝叶斯定理就派上用场了。令
和
分别是D和T发生的概率,
是T已经发生的前提下D发生的概率,贝叶斯定理是
证明这个定理很简单,因为它等价于,这个新方程两边都等于D和T同时发生的概率。 这个定理看似简单,却有很多用处,例如可以用来推出一个迭代关系,当数据增加时,这个迭代关系可以用来计算在增加数据以后T成立的概率。我们不在这里认真地将贝叶斯定理用在宇宙学上,但举一个日常的例子说明贝叶斯定理的用处。这个例子最近出现在同人于郊的博客里。
假定路人甲去医院体检,查出艾滋呈阳性,那么,他真正感染上艾滋的概率是多大?现在,令D是艾滋阳性事件,真正得艾滋的事件为T,我们想知道概率。贝叶斯定理告诉我们
,所以我们需要知道另外三个数字,
是一个感染艾滋的病人被查出的概率,
是任何一个人感染艾滋的概率,而
是任何一个人被查出艾滋阳性的概率。我们知道的数据是,一万个人中有一个感染艾滋,所以
,一个感染艾滋的人被查出的概率高达99.9%,所以
。最后,我们需要知道
,即任何一个人查出艾滋阳性的概率。这个人可能感染艾滋,可能没有感染,所以
,其中NT是没有感染艾滋,如果没有感染艾滋被误诊为阳性的概率是
,这个公式告诉我们
。最后,用贝叶斯定理我们得到
。这个结果很反直觉,可怜的路人甲只有一半机会真的感染了艾滋。
2009年10月7日 14:41:00
补充,上文一处想通了应是这样:
本人医学结果正确率与本人的就医态度有关;
公众医学结果正确率与公众的就医态度有关。
若有合理理由就医,其合理性会增加结果的可信度(所以医生是将问诊和仪器报告综合考虑)。
文中举例情形相当于本人盲目就医,且仪器误诊率和实际得病率一样,那样才得到等于没说的
的概率。
2009年10月7日 15:00:24
谁得了诺奖,我一点也不知道,刚才还在呼呼睡大觉。
2009年10月7日 15:07:59
dirson:
你说的两个数字无关的是正确的。
2009年10月7日 15:57:34
39 歪鸟
作为这个博客的访客,炎症浸膏泥,我才是砖家。
把力作用产生变速过程说成是三维空间中存在动量–能量张量,可以在时间坐标上形成三维空间的变速产生推力,这样好解释引力透镜现象,但是你要听李博导的教导,引力对能量形式也有作用。
2009年10月7日 22:42:06
haha!我的博客样子妆扮好了,李老师有空来瞅瞅 ^__^
2009年10月8日 15:36:58
一直潜水中。。。。
见李老师举例时提到路某的名字,心窃乐之!
见李老师要把人甲我往艾滋上整,心又惧之!
二者相攻胸中而不能任,以致面有菜色。。。
詩曰:“如琢如磨。如之奈何?”
2009年10月8日 16:19:45
好,路人甲出来啦!
你去医院检查上一万次,上面那个反直觉的结果就没有啦!
1.如你确实患有该病,P(T)=1;P(D)=P(D|T);P(T|D)=1.满足贝叶斯定理。
2.如你没有患病,P(T)=0;而P(D|T)和P(T|D)无意义。把上式中T换成NT,满足贝叶斯定理。
如果按同人于郊老师的做法,P(T)是任何一个人感染艾滋的概率,而P(D)是任何一个人被查出艾滋阳性的概率。那么对于那些没有患病的统计个体P(D|T)和P(T|D)没有意义,所以不能应用贝叶斯定理。
呵呵,开个玩笑,路人甲不是特指路人甲,是有个人,而人要个名字,路人甲最简单,所以叫路人甲。
听说“孔乙己”是练字的字帖上的前三个字所以叫“孔乙己”,我看“乙己”应该是,“孔”字估计不是!
2009年10月8日 16:24:31
前6个字是“上大人孔乙己”?
也不一定
:)
2009年10月8日 16:39:13
路人甲:
:)
2009年10月8日 16:48:12
袖袖,你看对吧。。。李老师的微笑标明。。。就是举例说我啊。。。
否则他老人家怎么不举“甲乙丙”的名字呢?这个更简单啊。。。
比如说,秦国有个著名的将领就叫“白乙丙”:(
自言自语中:据说是白姓人的祖宗。其实他是名丙,字白乙。。。不知怎么就成了白姓人的祖宗了,而且到现在还搞不清他到底是蹇叔的儿子,还是百里奚的儿子。。。真是晕。。。(悄悄滴看了一下四周,还好没有白姓人,否则要挨扁)。。。
2009年10月8日 17:11:06
路人甲:
:)
2009年10月9日 18:51:35
感觉P(D/NT)假设得太大了,假定说是0.0001可能是直观上也觉得可以,但实际上是非常非常小的
2009年10月9日 19:37:03
游客:
不是假设。
2009年10月10日 8:55:19
P(D/NT)=1-P(D/T),被检测出阳性的人有两种:得艾滋的和没得艾滋的,1减掉P(D/T)就是P(D/NT)了,是这样吗?
李老师,你说P(T/D)的结果反直觉,有临床上P(T/D)的数据吗?是否支持这种反直觉?呵呵
2009年10月10日 9:40:13
晕,这样的话P(T/D)=(0.999*0.0001)/(0.999*0.0001+0.001*0.9999)约等于1/11,更反直觉。或者把P(D/T)调大一些,比如:P(D/T)=0.99999,那么P(T/D)=(0.99999*0.0001)/(0.99999*0.0001+0.00001*0.9999)约等于1/1.1,接近直觉了
我还是怀疑我说的”P(D/NT)=1-P(D/T),被检测出阳性的人有两种:得艾滋的和没得艾滋的,1减掉P(D/T)就是P(D/NT)了”是否对
汗,最后忘了回答 “10 加 1 等于几? (必须填写,为了防spam)”,提交几次说错误,还以为写了什么敏感词
2009年10月10日 13:23:22
游客:
不知道有没有临床数据。
2009年10月10日 18:11:09
李老师,我转载了这篇日志,在我空间….我知道您不会反对..
2009年10月10日 18:29:33
淡定淡定….
请加《新发现》专栏。
2009年12月9日 10:29:50
李老师,《新发现》的编辑弄错您文章里的符号了:他们把第四段、第七段和第八段的P(T|D)写成了P(P|D),还有“T已经发生的前提下D发生的概率”也写成了P(P|D),贝叶斯公式他们倒是没弄错~~~~
2009年12月9日 11:14:53
广少:
:(