设为首页 加入收藏 期刊导航 网站地图
  • 首页
  • 期刊
    • 数学与物理
    • 地球与环境
    • 信息通讯
    • 经济与管理
    • 生命科学
    • 工程技术
    • 医药卫生
    • 人文社科
    • 化学与材料
  • 会议
  • 合作
  • 新闻
  • 我们
  • 招聘
  • 千人智库
  • 我要投搞
  • 办刊

期刊菜单

  • ●领域
  • ●编委
  • ●投稿须知
  • ●最新文章
  • ●检索
  • ●投稿

文章导航

  • ●Abstract
  • ●Full-Text PDF
  • ●Full-Text HTML
  • ●Full-Text ePUB
  • ●Linked References
  • ●How to Cite this Article
Advances in Psychology 心理学进展, 2014, 4, 26-32
http://dx.doi.org/10.12677/ap.2014.41006 Published Online January 2014 (http://www.hanspub.org/journal/ap.html)
OPEN ACCESS
26
Application of Bayesian Data Analyses in
Psychological Research
Xu Shen
Psychology Department, School of Social Science, Tsinghua University, Beijing
Email: shenxu2011@gmail.com
Received: Nov. 14th, 2013; revi s ed: Nov. 22 nd, 2013; accepted: Dec. 3rd, 2013
Copyright © 2014 Xu Sh en. This is an open access article distributed under the C reative Commons Attribution Licens e, which permits
unrestricted use, distribu tion, and reproduction in any medium, pro vided the original work is properly cited. I n accordance of the Crea-
tive Commons Attribution License all Copyrights © 2014 are reserved for Hans and the owner of th e intellectual property Xu Shen . All
Copyright © 2014 a re guarded by law and by Hans as a guardian.
Abstract: In recent years, the Bayesian Data Analysis method has increasingly received attention from psy-
chological researchers. This method allows them to directly and objectively estimate the probability of a re-
search hypothesis by deriving a posterior probability from the prior distribution and their own research data,
or to use the Bayesian factor to directly compare which of two hypotheses can better explain their data. In
this literature review paper, we summarized several major strengths of this inference method and its deficien-
cies. We used examples to illustrate how it can be used in psychological research and summarized some
software and textbooks that psychological researchers can use to learn the Bayesian data analysis method.
This article aims to introduce a supplementary method into psychological research.
Keywords: Bayesian Data Analysis; Bayes Factor; Hypothesis Testin g; Posterior Probability
贝叶斯推论统计在心理学研究中的应用
沈 序
清华大学社科学院心理系,北京
Email: shenxu2011@gmail.com
收稿日期:2013 年11 月14 日;修回日期:2013 年11 月22 日;录用日期:2013 年12 月3日
摘 要:近年来贝叶斯统计学越来越受到心理学界的关注。该方法的基本逻辑是综合先验信息和实验
结果得出一个后验概率,令研究者可以直接地、客观地检验研究假设,或使用贝叶斯因子比较哪种研
究假设能更好解释实验数据。本文总结了这种方法的优势和劣势,举例说明如何在心理学研究中应用
它,并介绍了可以使用的软件和教材,以此作为对当前心理学研究中统计方法的一种补充。
关键词:贝叶斯数据分析;贝叶斯因子;假设检验;后验概率
1. 引言
心理学实验数据分析中的核心问题之一是如何
根据实验结果做出合理的统计推断。在理论发展中,
统计推断衍生出了两套体系:频率学派与贝叶斯学派
(陈希孺,1999),因此产生了虚无假设检验方法与贝
叶斯统计方法这两种不同的推论统计方法。
虚无假设检验(Null Hypothesis Significance Test)
是一种证伪方法,不能直接检验研究者关于实验效应
的研究假设。研究者需要设立一个关于实验效应不存
在的虚无假设,用 H0表示,而把自己的研究假设作
为备择假设,然后通过对抽样所得的数据进行统计学
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
27
计算,进而判断是否拒绝虚无假设。如果能够拒绝虚
无假设,则不能拒绝备择假设;如果不能拒绝虚无假
设,则只能拒绝备择假设。虚无假设检验方法在心理
学界广为使用,Cumming 等(2007)对1998年到 2006
年4月心理学界中的 10 种主要期刊的统计方法进行
抽样分析发现,虚无假设检验的使用率大于 96%。但
是,近年来这种统计方法的缺陷和不足也引起越来越
多的质疑(仲晓波,王希尧和万荣根,2008;甘怡群等,
2005)。
贝叶斯统计方法则认为,在进行统计推断问题时,
除了使用抽样所得的样本数据之外,也必须考虑抽样
前就有的先验分布。也就是说,研究者在进行推论统
计时应首先获得关于研究对象的先验概率,再根据抽
样所得的实验结果校正先验概率而得到后验概率 ,从
而直接检验研究假设。贝叶斯统计方法是建立在贝叶
斯法则的基础上的。根据 Fienberg(2006)的总结,贝
叶斯法则是英国牧师贝叶斯(Thomas Bayes,1702~
1763)在研究二项分布的参数问题时发现的,并在他去
世后由他的朋友普赖斯(Richard Price)整理成文并发
表。学界一般认为,拉普拉斯(Pierre -Simon Laplace)
在贝叶斯去世十二年后独立地得出了与贝叶斯相同
的结论并有所扩展。尽管贝叶斯统计在十八世纪就已
正式地登上统计学的舞台,但是因为它所依赖的先验
分布受到研究者主观决定的影响,因此直到 20 世纪
30 年代随着统计学界对“逆概率”(inverse probability)
和先验分布问题的研究进展,以及贝叶斯统计在如序
列分析中的应用,贝叶斯统计才得到较为广泛的重视。
到20 世纪 80 年代,贝叶斯统计开始在统计学领域占
有越来越重要的地位,并在农学、天文学、生物学、
生态学、动物学、气象学等科学领域得到应用。在心
理学实验中应用贝叶斯统计方法最早至少可以追溯
到1963 年Edwards, Lindman和Savage 的工作。在过
去的十年内,贝叶斯统计分析方法因为它在模型比较
和多重比较中的优势和它在逻辑上的直观性受到了
心理学界更多关注(Dixon, 2003; Lee, 2008; Myung,
Foster & Browne, 2000; Rouder, Speckman, Sun, Morey,
& Iverson, 2009;仲晓波,黄希尧和万荣根,2008)。
另外,Kass 和Rafter y(1995)则提出了将贝叶斯因子这
种比值形式用来作为测量数据对实验效应支持强度
的一种标准方法。
本文介绍了贝叶斯统计方法的逻辑与基本计算
过程,并结合具体的研究实例,说明贝叶斯统计方法
在心理学研究中的实现以及它如何可以避免 p值检验
方法存在的不足。最后,本文还介绍了贝叶斯统计在
未来的发展趋势及其对心理学研究方法论革新的深
远影响。
2. 贝叶斯推论统计检验
尽管心理学研究中的推论统计至今很大程度上
还依赖于虚无假设检验,一些 心理学家已经注意到了
这种方法的缺陷并提出了两种修正的方案。第一种是
改良方案,即在报告p值的基础上,在统计结果中增
加置信区间、标准误、效应量的报告(Cohen,1994)。
这种方案提出十几年之后,Cumming等(2007)对心理
学界中的10种主要期刊进行了抽样,试图分析出传统
统计方法在心理学界的应用是否有所变化。他们对这
10种期刊均从1998年、2003至2004年,2005年至2006
年4月这三个时间段中出版的40篇文献进行分析,结
果发现在这3个时期中虚无假设检验的使用率分别为
97.8% 、97.7% 和96.9%,但是对于置信区间的使用仍
仅有3.7%、9.2%和10.6%。这些数据表明,改良方案
并未得到足够的重视和广泛的实施。第二种方案,则
是使用贝叶斯统计方法。
2.1. 贝叶斯推论统计的基本逻辑
传统的假设检验与贝叶斯推论统计最大的区别
在于对“不确定性”这个概念的理解。前者认为实验
得到怎样的数据 X是不确定的,为随机变量,而研究
者感兴趣的参数 θ则为固定值。后者则认为我们实验
观察得到的数据是确定的,而由于我们知识的缺乏或
对某个现象的不了解,感兴趣的参数 θ是不确定的,
为随机变量。
在贝叶斯统计的框架中,研究者用先验分布
( )
p
θ
来概括前人和自己对某个感兴趣参数已有的知
识。在先验模型下结合实验得到的数据根据似然原理
(似然函数包含了样本中的所有信息)研究者得到似然
函数
( )
px
θ
。以简单的抛硬币问题为例,如果研究
者想研究硬币是否为均质的(正反面朝上的概率相等)
做了 Z次抛硬币实验,有N次朝上,则在这个问题中
的似然函数
( )
px
θ
即为将实验得到的观察值 x1,
x2, … xn代入伯努利分布的概率密度函数,即
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
28
( )
1
1
1
i
ix
x
Nz Nz
i
θ θθθ
−−
=
Π −=
。频率学派的虚无假设检验
认为,推论统计应该根据整个样本空间做出;而在贝
叶斯推论统计方法中,只有实验以后得到的证据才能
用于推断,推断只根据在实验后所收集到的观察值做
出,似然函数体现的也正是这一点(Glover & Dixon,
2004)。最后贝叶斯统计学家用实验数据更新自己有关
某个参数的先验信念,得到有关参数的后验分布
( )
px
θ
。后验分布
( )
px
θ
与似然函数
( )
px
θ
和先验
分布
( )
p
θ
的乘积呈正比。后验分布的计算可通过贝
叶斯法则完成,以连续性变量的问题为例,后验分布
为
( )
()( )
( )
()( )
()( )
px ppx p
px px dpx p
θ
θθ θθ
θ
θθ
== ∫
(Carlin & Louis, 2008; James & Press, 1989; Kruschke,
2010)。
关于先验分布
( )
p
θ
的确定原则在学界仍有较大
的争议。Stern(2005)提出,一般有三种方法获得先验
分布:即以均匀分布为代表的无信息先验分布;研究
者结合自己研究经验和知识确定的先验分布;以及为
了数学上计算方便保持先验分布和后验分布在形式
上一致而将似然函数与先验分布设置成共轭分布。无
论采用哪种方法,心理学研究中的先验分布需要根据
过去公开发表的、可重复的研究结果确定,经过同行
评审,并且被广泛接受(Kruschke, 2010)。另外在贝叶
斯统计框架中,传统的假设检验方法其实也可以被视
作在实验开始前视感兴趣的参数有等可能取不同的
值,即先验分布为无信息的均匀分布的一种贝叶斯统
计的特殊形式。如果在操作中研究者使用无信息均匀
分布为先验分布,那么贝叶斯推论统计与传统统计在
功能上相似。
2.2. 贝叶斯推论统计的实现
在贝叶斯统计中,研究者数据分析的结论都可以
根据后验分布
( )
px
θ
做出。因此得到的结论更加丰
富、全面、系统,而非一个简单的“是否”有影响的
二分法论断。研究者可以利用后验概率
( )
px
θ
进行
参数估计和区间估计。如果 θ的分布范围较小,则可
能值的确信程度较高;如果 θ的分布范围较大,则 θ
可能值的确信程度较低。在贝叶斯统计的点估计中,
可以根据求得的实验数据的统计量
( )
y
θ
估计 θ,普遍
选取统计量的标准是能使损失函数
( )
( )
2
|y
Ey
θ
θθ
−
最
小,基于该损失函数,Louis 和Carlin(2008)得出在众
数、中位数和平均数三个统计量中,后验分布的平均
数为最佳点估计值。研究者使用贝叶斯统计进行区间
估计,与虚无假设检验假设检验方法中的置信区间类
似。贝叶斯统计使用最高后验密度(Highest posterior
density)来表示能够覆盖绝大多数后验分布区域的区
间,例如 95%的区间,这种区间 C可表达为:
()( )
{ }
:C pxk
θθα
= ∈Θ≥
且
( )
k
α
是满足
( )
1PCy
α
≥−
不等式的最大常数
(Brooks, 2003, Kruschke, 2010)。
研究者还可以使用贝叶斯因子(Bayes Factor)比较
两个或多个模型或假设对实验数据的 解释能力 (Jef-
freys, 1961; Kass & Raftery, 1995)。贝叶斯因子指在一
种假设模型下实验数据出现的概率与另一种假设模
型下实验数据出现的概率的比值。以心理学研究中经
常需要比较的虚无假设模型 H0和备择假设模型 HA为
例:比率
( )
( )
0
A
pDH
pDH
可以用来衡量哪个模型得到更多
的证据支持(Jeffreys, 1961)。如果贝叶斯因子为2,则
说明在模型下 HA出现实验结果的可能性是模型 H0下
出现同样实验结果的两倍;贝叶斯因子越大,则实验证
据就更强有力地支持模型 HA(Goodman, 2005)。使 用贝
叶斯因子令研究者可以更好地权衡两个模型的解释
数据的力度,而不仅仅是简单地接受或拒绝某一个模型。
2.3. 贝叶斯推论统计的优势
与虚无假设检验的方法相比,贝叶斯统计方法在
逻辑上更加严密。第一,贝叶斯统计方法用计算得到
的后验概率
( )
0
pH X
表示基于实验数据和结果 X的
前提下 H0为真的概率,即直观地说明了虚无假设为
真的可能性,而不是像传统的假设检验方法那样估计
了如果 H0为真,重复无数次实验出现观察到的实验
结果的可能性。
第二,贝叶斯统计中可以 使用贝叶斯 因子
( )
( )
1
2
pDM
pDM
表示虚无假设条件下实验结果出现的概
率与备择假设条件下实验结果出现的概率的比值,直
观地说明了虚无假设和备择假设这两种模型中究竟
是哪一种能更好地解释实验数据,而不是简单地得出
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
29
“接受”或“拒绝”的结论。
第三,贝叶斯统计分析中的虚无假设是备择假设
的一个特例,即 H0是Ha, a = 0时的一个特例,所以
研究者可以更加自由地使用贝叶斯统计来比较两个
不同的模型,这两个模型可以类似于虚无假设检验中
的虚无假设和备择假设,也可以类似于虚无假设检验
中的两个备择假设。例如,某研究者在采集了20 个
观察值后发现自变量对因变量存在主效应并想弄清
楚这种效应是以怎样的形式作用,就可以对自变量和
因变量进行线性回归和二次曲线回归,然后通过计算
贝叶斯因子比较这两个模型中谁能更好地解释数据:
( )
( )
2
22
1
2
2
1
ˆ1
ˆ1
n
pX R
BF R
pX
θ
θ

−
== 
−

,
其中 R1和R2代表两种不同回归模型得到的残差
(residual) (Glover 和Dixon, 2004)。
贝叶斯推论统计在实际操作中能更好地降低因
为实验者的主观意愿和偏见比如研究者认知的系统
性偏差、缺失值处理方法、抽样方法、多重比较校正
方法和实验停止标准等影响客观实验结果的强度。
首先,人类在对不确定事件判断时存在的系统偏
差之一是对有关先验概率或者基率信息(baseline rate)
不敏感(Kahneman 和Tversky, 1982) ,而 贝叶斯统计方
法中先验分布的确定过程帮助研究者克服这一偏差。
其次,贝叶斯统计分析的结果受到似然函数和先验分
布影响,而似然函数中的数据都是来自实验已经观察
到的数据。这令贝叶斯统计分析不会受到实验者抽样
方法和实验停止标准等主观意愿的影响。而虚无假设
检验的推断要根据观察到的数据和未观察到的样本
空间做出,而样本空间的大小则会可能受到研究者的
操控。第三,在使用虚无假设检验进行多重比较时,
研究者使用的不同的校正方法可能得到不同的结论,
使结论受到研究者的主观影响;在贝叶斯统计过程中,
由先验分布和似然函数决定的后验分布涵盖了有关
数据的所有信息,研究者可以根据自己的研究兴趣自
由地从不同角度对各类实验条件进行比较分析,比较
的次数多也不会增加犯第I类错误的可能性。最后,
贝叶斯推论统计对实验缺失值的处理也更加完善,在
该框架下,数据被分为两种类型,未观察到的参数和
观察到的数据。遵循以上逻辑,实验中的缺失值可以
被视作一种未被观察到的参数值体现在似然函数中。
具体操作可使用数据增强(data augmentation)的算法。
鉴于篇幅原因,本文不展开介绍,有兴趣的读者可参
考Tanner 和Wong(1987)关于如何在贝叶斯统计产生
的后验分布中使用该方法的综述文章。
3. 贝叶斯统计方法在心理学研究中的应用
为了使读者对贝叶斯统计有更直观的理解,本文
举两个具有代表性的例子说明贝叶斯统计方法在心
理学研究中的应用,尤其是关于贝叶斯统计方法和虚
无假设检验方法可能对相同的实验结果做出不同的
解释,其中一个是 Bem(2011)关于人类是否具有心灵
感应能力的研究,另一个是作者正在进行的研究。
Bem(2011)试图用 10 个实验和虚无假设检验的统
计方法证明,人们拥有某种未卜先知的能力,在实验
中这种能力表现为对色情刺激的趋近和对负性情绪
刺激的回避。他的虚无假设为H0 = 不存在预知能力,
备择假设 H1 = 存在预知能力。在他的实验1中,被
试的任务是按键选择幕布图片后面是色情图片还是
普通图片,结果发现色情图片的选择正确率为53.1%,
t(99) = 2.51, p = 0.01,这显著地高于随机水平;其它
几个实验也用类似的范式得出了显著的结果。但是,
Wagenmakers, Wetzels, Borsboom和Maas(2011)指出,
Bem(2011)没有考虑“H0 = 不存在预知能力”的先验
概率。理论上,人的未卜先知能力缺乏生理心理证据;
现实中,人们并不能预知未来,Wagenmakers 等人以
Bem 实验得到的结果 53.1%计算赌徒在赌场中一年的
预期收益,发现收益极高,数值几乎可以让世界上任
何一个赌场经营者破产。基于这两个事实,
( )
0
pH
的
先验概率极高,Wagenmakers 等用 9 × 10−20 来表示预
知能力存在的概率。即使验证性的实验结果 100%地
证实了实验结果在 H1 = 存在预知能力模型下发生,
则根据贝叶斯法则可以得出一个后验概率
( )() ()
() ()
() ()
11
10 011
20
20 20
19
0.95 10
0.05(110)0.95 10
1.9 10
pDH pH
pH DpDHpHpDH pH
−
−−
−
=+
×
=− +×
= ×
,
计算结果表明当考虑实验结果以后对人类存在预知
能力的后验信念比先验概率大,但仍旧是很小的数值,
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
30
令我们相信这种超能力几乎不可能存 在。Wagenmakers
等人(2011)利用贝叶斯 t检验方法重新分析 Bem(2011)
的结果以后发现,上文提到的实验 1的贝叶斯因子仅
为1.64;如果按照贝叶斯因子的大小进行衡量,他的
10 个实验中只有1个支持他的结论,3个支持相反的
结论,其余的只能为他的结论理论提供传闻性的证据
(anecdotal evidence)(Jeffreys, 1961)。
下文将介绍的第二个例子是作者有关情绪图形
的视觉搜索研究中的一个实验(Shen 和Wan, in prep-
aration)。大量的实验证据证明迅速地判断出刺激物中
含有的威胁或恐怖的情绪信息对人类的生存与繁衍
至关重要。研究证明,在情绪面孔的识别中含有更多
类似 V形尖角形状的面孔传递出愤怒信息,而含有更
多圆角的面孔则传递出愉悦信息(Aronoff, 2006)。
Larson, Aronoff和Stearns(2007)等人的研究也证明在
视觉搜索中搜索∨图形比搜索∧图形更快更准确。基
于以上发现,采用类似的范式对中国被试进行重复实
验,利用传统假设检验框架下成对样本 t检验发现在
4 × 4的矩形框中在∧背景下搜索∨的反应时显著地
快于在∨背景下搜索∧,t(17) = 2.11,p = 0.03。
如果对此实验重新进行贝叶斯统计框架下的t检
验,那么就需要计算在虚无假设模型 H0: μ1-μ2 = 0下
和备择假设模型下 H1: 12
0
µµ
−≠
出现实验观察到数
据的概率的比值,也称为贝叶斯因子
( )
( )
12
12
0
0
Px
Px
µµ
µµ
−≠
−=
。同时贝叶斯统计也可以得到两组实
验条件下参数平均反应时的
12
µµ
−
后验分布。在数据
分析中,采用的参数的先验分布为 JZS 先验分布
(Jeffreys-Zellner-Siow Prior),关于 JZS 先验分布的特
性以及在 t检验情况下使用它的功能以及优势的相关
细节可参见(Rouder, Speckman, Sun, Morey, & Iverson,
2009)的工作。
使用 Morey 和Rouder(2013)开发的贝叶斯因子软
件包(BayesFactor)进行检验分析发现贝叶斯因子为
2.385,根据Jeffreys(1961)给出的证据属性与贝叶斯因
子的对应表格,2.385 的贝叶斯因子仅能为备择假设
模型即在∧背景下搜索∨的反应时显著地快于在∨
背景下搜索∧提供传闻性证据(anecdotal evidence),而
非重要证据(substantial evidence)或者强有力证据
(strong evidence)。利用该软件包笔者也可以计算两组
实验条件下的参数实验效应量
12
d
µµ
σ
−
=
的后验分
布的概率密度函数,如图1所示。
4. 贝叶斯统计方法的评价与前景展望
贝叶斯统计的兴起在未来的心理学发展中可能
称为方法论上的一个重要革新。总体而言,贝叶斯统
计从四个方面弥补了虚无假设假设检验的不足。第一,
虚无假设检验方法只能证伪拒绝虚无假设却不能直
接提供有关备择假设在多大程度上成立的信息,而贝
叶斯统计方法在比较不同模型的基础上能给出量化
的评价标准。第二,科学理论的建立依赖于可重复的
实验,但是虚无假设的显著性水平检验不利于实验的
可重复性。Miller(2009)认为在频率学派的理论框架中
实验得到的一些点估计值如平均数或者标准差只能
对实验结果的重复概率(replication probability)提供非
常少量的信息,实验重复的概率对后续研究者几乎是
不可知的。相反由于在贝叶斯统计中,研究者得到的
是整个后验概率的分布,他可以将原先实验得到的后
验分布作为下一个重复实验的先验分布,并从这个先
验分布中模拟地产生出新的数值。通过比较这些模拟
产生出的新数值与原先实验得到的数据,研究者可以
估计实验重复的概率(Kruschke, 2010)。第三,虚无假
设检验中的 p值仅针对虚无假设下观察到的数据出现
的概率,并且虚无假设常常是关于实验效应为零的假
设,而贝叶斯统计方法中的贝叶斯因子令研究者可以
Figure 1. Probability density function of effect size
图1. 实验效应量的概率密度函数
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
31
自由地比较不同的模型,包括比较虚无假设和备择假
设,或是比较两个不同的备择假设。第四,虚无假设
检验容易受到实验设计、停止实验的准则、实验中的
数据缺失以及实验者选择的多重比较的方法等主观
意愿的影响,而贝叶斯统计则对这些因素不敏感。需
要强调的是,虽然本文中总结了虚无假设检验的缺陷
和贝叶斯统计分析的优势,我们并不认为应摒弃虚无
统计检验方法,这种方法在心理学研究中的重要性是
不容置疑的。在实际研究的过程中,是选择虚无假设
检验的方法,还是贝叶斯统计方法,应联系实际情况,
各取所长。在参数模型确定且样本量不大的情况下,
贝叶斯方法比虚无假设的方法更具有逻辑上的严密
性和操作上的客观性。但是在非参数模型下,先验分
布不容易设定,虚无假设检验的方法仍然具有强大的
优势。我们建议,在条件允许的情况下,研究者可以
对自己的研究数据同时采用虚无假设检验和贝叶斯
统计分析,相互验证后得出更为完整、客观的结论。
如果要在心理学研究中使用贝叶斯统计,有两个
问题需要引起注意。一方面,贝叶斯统计的计算过程
比较复杂,尤其实际研究中产生的后验分布可能非常
繁琐,这使针对后验分布的一系列计算很难进行。但
是,近几十年来统计软件 R的普及、BUGS 工具包的
开发以及马尔科夫链蒙特卡罗算法(Markov chain
Monte Carlo(MCMC))的不断发展比较有效地解决了
这一难题。马尔科夫链蒙特卡罗算法是指一种从后验
分布中进行抽样,从而求得待估参数近似值的算法。
R软件是免费开源的,并且它可以自由地引用其他功
能强大的软件,能够实现蒙特卡洛算法的 OpenBUGS
工具包就是其中之一。蒙特卡罗算法的核心是从任意
复杂的后验分布(比如贝叶斯推论统计的后验分布)中
产生一系列观察值,然后通过计算这些观察值来高度
近似研究者感兴趣的实际量(Smith和Roberts, 1993) 。
BUGS 工具包最早发明于 1996 年,该工具包中的语言
使得用户能够在构建完统计模型,即输入先验分布与
似然函数后,自动通过蒙特卡罗算法计算后验分布中
研究者感兴趣的统计量。仍以抛硬币为例,如果希望
结合实际抛硬币的实验数据来计算正面朝上的概率,
则BUGS 语言在 R平台上的实现方法就是:搭建统计
模型,设立先验分布为 Beta 分布,似然函数为伯努利
概率密度函数,随后导入实际的实验数据。关于在 R
软件中进行贝叶斯统计的方法和具体步骤,可以参考
Ntzoufras(2011)出版的 Bayesian Modeling Using
WinBUGs,这 是一本兼具统计原理和计算机语言实现
方法的高质量教材。Kruschke(2010)所著的 Doing
Bayesian Data Analysis: A Tutorial with R and BUGs同
样是较好地能够帮助初学者迅速领略到贝叶斯统计
的思想核心的高质量教材,另外由于该书的作者是心
理学家,因此教材中的许多内容紧扣心理学研究,对
如何用贝叶斯统计实现方差分析、t检验、计算统计
效力、确定样本数量都做出了详细的介绍。
另一方面,贝叶斯推论统计中确定先验分布是容
易受到质疑的地方。许多批评认为先验分布的确定是
个主观性太强的过程。但是笔者想强调的是先验分布
并不是随意确定的,而应该受到同行的检验与评审。
如果有学者提出反对意见,那么也可以在怀疑者认为
更可信的先验分布下重新分析,检验的过程也较为简
单,只需要在搭建统计模型时重新设置先验分布的概
率密度函数与决定该函数的关键参数,其余计算过程
照旧。除此之外,先验分布确定的过程也有利于科学
界知识的不断积累,研究者可以更好地把自己的研究
与过往与自己相似的研究联系起来,广泛吸收已有的
成果与成熟的结论使自己的分析更加深刻,这个过程
也能促进科学知识的传承。
当然,贝叶斯统计本身的一些问题也制约着它的
发展。第一,如何较为客观地确定先验分布这一问题
一直没有得到很好地解决。第二,后验分布概率密度
函数的计算较为复杂。然而随着关于对各种先验分布
研究的丰富和越来越多的统计工具包的普及,贝叶斯
统计的应用也必将越来越广泛。事实也证明,近年来
在美国许多以研究为导向型的经济学、生物学、社会
学和心理学研究生项目中,项目会至少开设一门关于
贝叶斯统计的课程,比如印第安纳大学伯明顿分校
(Indiana Universit y Bloomi ngt on)心理系在 2013年开设
了贝叶斯统计的入门课程、密歇根大学安娜堡分校
(University of Michigan, Ann Arbor)在2012 年起也开
始定期举办关于贝叶斯统计的工作坊。在教学过程中,
Wetzels,Grasman和Wagenmakers(2012)等人总结认
为如何教会学生用一个默认的先验分布以及如何使
用R语言进行贝叶斯统计的实践是两个较为核心的问
题。而学习者只要掌握基础的概率论知识以及 R软件
贝叶斯推论统计在心理学研究中的应用
OPEN ACCESS
32
的操作方法,结合实际的研究问题,经过一定时间的
训练,掌握贝叶斯统计也并非十分耗时耗力的事。
致谢
作者感谢宛小昂博士对本文初稿给出的宝贵建
议。
项目基金
清华大学人文社科振兴基金;清华大学文化传承
创新基金项目;清华大学亚洲研究中心 2012 青年项
目支持。
参考文献 (References)
陈希孺(1998). 数理统计学小史. 数理统计与管理, 2期, 60-64.
甘怡群等(2005). 心理与行为科学统计. 北京: 北京大学出版社.
吕佳, 乔克林(2010). 浅谈假设检验中的 P值. 科学技术与工程, 10
期, 1671-1815.
仲晓波, 黄希尧, 万荣根(2008). 心理学中对假设检验一些批评的
分析. 心理科学, 4期, 1010-1013.
Aronoff, J. (2006). How we recognize angry and happy emotion in
people, places, and things. Cross-Cultural Research, 40, 83-105.
Bem, D. J. (2011). Feeling the future: Experimental evidence for ano-
malous retroactive influences on cognition and affect. Journal of
Personality and Social Psychology, 100, 407.
Brooks, S. P. (2003). Bayesian computation: A statistical revolution.
Philosophical Transactions of the Royal Society of London. Series A:
Mathematical, Physical and Engineering Sciences, 361, 2681-2697.
Carlin, B. P., & Louis, T. A. (2008). Bayesian methods for data analysis
(Vol. 78). Chapman & Hall/CRC.
Cohen, J. (1994). The earth is round (P-less-than.05). American Psy-
chologist, 49, 997-1003.
Cumming, G., Fidler, F., Leonard, M., Kalinowsk i, P., Christiansen, A.,
Kleinig, A., Lo, J., Mc Mena min, N., & Wilson, S. (200 7). Statistical
reform in psychology: Is anything changing? Psychological Science,
18, 230-232.
Dixon, P. (2003). The p-value fallacy and how to avoid it. Canadian
Journal of Experimental Psychology, 57, 189-202.
Edwards, W., Lindman, H., & Savage, L. J. (1963 ). Bayesian statistical
inference for psychological research. Psychological Review, 70, 193-
242.
Fienberg, S. E. (2006). When did Bayesian inference become “Baye-
sian”. Bayesian Analysis, 1, 1-40.
Glover, S. , & D ixon, P. (2004). Likelihood ratios : A simple and flexible
statistic for empirical psycholog ists . Psycho no mic Bulletin & Review,
11, 791-806.
Goodman, S. N. (2005). Introduction to Bayesian methods I: Measur-
ing the strength of evidence. Clinical Trials, 2, 282-290.
Jeffreys, H. (1961). Theory of probability. Oxford: Oxford University
Press.
Kahneman, D., Slov ic, P., & Tve rsky, A., Eds. (1982). Judgment under
uncertainty: Heuristics and biases. Cambridge University Press.
Kass, R. E., & Raftery, A. E. (1995). Bayes factors. Journal of the
American Statistical Association, 90, 773-795.
Kruschke, J. (2010). Doing Bayesian data analysis: A tutorial introduc-
tion with R and BUGS. Academic Press.
Kruschke, J. K. (2010). Bayesian d ata analysis. Wiley Interdisciplinary
Reviews: Cognitive Science, 1, 658-676.
Larson, C. L., Aronoff, J., & Stearns, J. J. (2007). The shape o f threat:
Simple geometric forms evoke rapid and sustained capture of atten-
tion. Emotion, 7, 526-534.
Lee, M. D. (2008). Th ree case studies in the Ba yesian analysis of cog-
nitive models. Psychonomic Bulletin & Review, 15, 1-15.
Lindley, D. V. (1965). Introduction to probability and statistics from
bayesian viewpoint. Part 2 inference. CUP Archive.
Lindley, D. V. (1975). The future o f statistics: A Bayesian 21st century.
Advances in Applied Probability, 7, 106-11 5.
Miller, J. (2009). What is the probability of replicating a statistically
significant effect? Psychonomic Bulletin & Review, 16, 617-640.
Morey, R. D., Rouder, J. N., & Morey, M. R. D. (2013). Package
“Bayes factor”.
ftp://ftp.openefs.org/pub/cran/web/packages/BayesFacto r/BayesF act
or.pdf
Mr. Bayes, & Price , M. (1763 ). An essay towards solving a problem in
the doctrine of cha nces. By the late R ev. Mr. Bayes, FRS co mmuni-
cated by Mr. Price, in a lett er to John Canton, AMFRS. Philosophi-
cal Transactions, (1683-1775), 370-418.
Myung, I. J., Forster, M., & Browne, M. W. (2000). Special issue on
model selection. Journal of Mathematical Psychology, 44, 1-2.
Ntzoufras, I. (2011). Bayesian modeling using WinBUGS (Vol. 698).
Wiley.
Press, S. J ., & Press, J. S. (1989). Bayesian statistics: Principles, mod-
els, and applications. New York: Wiley.
Rouder, J. N., Speckman, P. L., Sun, D., Morey, R. D., & Iverson, G.
(2009). Bayesian t tests for acceptin g and rejectin g the n ull hypothe-
sis. Psychonomic Bulletin & Review, 16, 225-237.
Shen, X., & Wan, X. Visual search for threatening and pleasant shapes.
Smith, A. F., & Roberts, G. O. (1993). Bayesian computation via the
Gibbs sampler and related Markov chain Monte Carlo methods.
Journal of the Royal Statistical Society, Series B (Methodological),
3-23.
Stern, H. (2005) . Bayes ian statistic s for experimental scientists: ANOVA
examples.
Tanner, M. A., & Wong, W. H. (1987). The calculation of posterior
distributions by data augmentation. Journal of the American Statis-
tical Association, 82, 528-540.
Wagenmakers, E. J., Wetzels, R., Borsboom, D., & Van der Maas, H.
(2011). Why psychologists must change the way they analyze their
data: The case of psi. Journal of Personality and Social Psychology,
100, 426-432.
Wetzels, R., Matzke, D., Lee, M. D., Rouder, J. N., Iverson, G. J., &
Wagenmakers, E. J. (2011). Statistical evidence in experimental psy-
chology an empirical comparison using 855 t tests. Perspectives on
Psychological Science, 6, 291-298.
Wetzels, R., & Wagenmakers, E. (2012). A default Bayesian hypothesis
test for correlations and partial correlations. Psychonomic Bulletin &
Review, 66, 104-111.

版权所有:汉斯出版社 (Hans Publishers) Copyright © 2012 Hans Publishers Inc. All rights reserved.