(文/Ed Yong)为了验证心理学实验的可靠性,一个庞大的国际研究组已经成功地重复了13个已发表的实验中10个的结果。他们同时也发现其中有两个实验结果无法被再现。
由于对心理学经典研究的重复实验一再失败,该学科的可信度正日益遭受质疑。重复实验失败有可能意味着最初的研究是有缺陷的,或者是重复的实验做得不对,要不然就是两次实验的环境设定或者针对人群不一致。
由于对心理学经典研究的重复实验一再失败,该学科的可信度正日益遭受质疑。图片来源:Pixabay/Tiyo Prasetyo
为了解决这个“可重复性危机”,36个研究小组组成了多实验室重复实验项目(Many Labs Replication Project)来重复13项心理学实验。这个联合体把这些先前做过的实验合并在同一个问卷之中——完成这张问卷需要15分钟——并交给来自12个国家的6344位志愿者来填写。
项目组选择了各种不同的效应,以代表心理学科学的多样性,题目来自已经得到多次重复的经典实验到从未重复过的当代实验。
有十种效应在不同样本中重复出现。其中包括诺贝尔经济学奖获得者,新泽西普林斯顿大学的心理学家丹尼尔•卡尼曼(Daniel Kahneman)的经典实验,例如得-失框架效应,说明与冒险来获得收益相比,人们更愿意冒险来避免损失;以及锚定效应,即人们首先获得的信息能对其后的决策产生影响。项目组所得到的锚定效应甚至比卡尼曼当初获得的还要强得多。
令人鼓舞的结果
“这项倡议对心理学确实意义重大,”加利福尼亚大学洛杉矶分校的心理学家丹尼·奥本海默(Danny Oppenheimer)说,他的研究正在审议之中,可是并没有参加此次合作。“这说明所谓的重复性问题,当然绝不是微不足道,但也不像这个领域的某些批评者所说的那样普遍存在。”
项目的共同领导人之一,弗吉尼亚州夏洛茨维尔市开放科学中心(the Center of Open Science in Charlottesville, Virginia)的心理学家布莱恩·诺斯克(Brian Nosek)认为这次的结果令人振奋。“这显示了我们的学科中那些重要的效应是能够可靠重复的,”他说。“不过这也不是说每13个效应中都有10个是可重复的。”
卡尼曼同意上述观点。这项研究“看起来非常成功,极具说服力,”他说,“尽管根据这一次努力,就对整个学科做出一个绝对性的结论实在是太早。”卡尼曼曾在2012年发表了一封公开信,呼吁对心理学中主要的一些效应进行“衔接式”的重复性检验,在这样的实验中,微妙的暗示有可能影响实验对象后来的行为。
在刚刚完成的这次检验中,全部13种效应中有一种只有微弱的效果,还有两种完全不能重复。两种不能再现的效应都与社会启动效应有关。其中一种是认为,人们在接触到金钱之后就会更加认同现行社会制度。另一种认为美国人见到美国国旗之后就会更加认同保守价值观。
领导最初的国旗启动效应研究的缅因州沃特维尔市科尔比学院(Colby College in Waterville, Maine)社会心理学家特拉维斯•卡特(Travis Carter)说他感到失望,不过他完全信任诺斯克的团队,但是在进一步评论之前需要先检验对方的数据。而领导最初的金钱启动效应研究的伊利诺伊州芝加哥大学行为科学家尤金·卡鲁索(Eugene Caruso)说:“我们应该利用这次未能再现的事实来更新我们对于该效应的可靠性和普遍性的信任,”这是因为考虑到这次多实验室项目“大得多而又多样得多的样本量”。上述两位研究者都赞扬了这次倡议。
文档公开
多实验室研究组的协调指导人还包括来自位于盖恩斯维尔(Gainesville)的佛罗里达大学的理查德·克莱因(Richard Klein)和凯特·拉特利夫(Kate Ratliff),以及来自意大利帕多瓦大学(University of Padua)的米开朗基罗·维亚内罗(Michelangelo Vianello),在这次研究中他们发现,无论是在线测试还是在实验室中,实验结果基本不受到接受测试的志愿者国籍的影响,也不怎么受到实验设置条件的影响。而存在影响的情况仅限于类似于锚定效应这样显著的效应之中,在类似于看到国旗的启动效应这样微小的效应中则没有发现。
这就反驳了一个被频繁提及的论调,即“有些心理学研究(尤其是那些关于微妙的社会启动效应的研究)之所以很难重复,是因为它们对于诸如测试对象或是最初实验者的技术水平这类条件的差异很敏感”的观点。社会启动效应研究难以重复的说法“对我个人而言就特别困扰,”诺斯克说,“因为社会启动效应是我的研究工作中很重要的一部分”。
只要条件允许,多实验室项目的计划都尽可能地请研究项目的原始作者审查,并记录在公开的文献中,刊载在《社会心理学》(Social Psychology)期刊上,其研究方法要求任何实验在完成之前都要经过同行评议。研究结果现已提交给期刊,可以在线查询。“这样的公开化应该成为所有科研工作的标准,”伊利诺伊大学厄巴纳-尚佩恩分校(University of Illinois at Urbana–Champaign)的丹尼尔·西蒙斯(Daniel Simons)说,他正指导着一项类似的合作研究,以验证未列入此次多实验室项目的心理学经典实验。“我希望这能够成为心理学上的一个标准方法。”奥本海默说,其他学科可以受益于此次多实验室的研究方法。“心理学并不是近年来唯一一个存在可重复性问题的领域。”
编译自:Ed Yong. Dozens of Labs Respond to Call to Bolster Reliability of Psychology Research. scientificamerican.com
文章题图:explorable.com