人们为什么反对实验

                                                                       

随机对照试验(RCT;有时也称为A/B检验)被认为是科学和医学证据的黄金标准.如果您没有从“研究方法101"课程中取得任何收获,那么应该去评估变量是否对结果有因果关系的最佳方法是进行随机实验.

然而,RCT和A/B测试经常会引起道德和道德上的异议.人们不喜欢自己觉得自己参与了实验.尽管如此,绝大多数实验都能产生有用的,有意义的数据,而不会给参与者带来比他们平时在日常生活中遇到的更大的风险.当然,毫无疑问,过去有一些研究人员在进行实验时犯下了严重的违反道德的行为.盖辛格(Geisinger)团队的最新研究表明,即使人们赞成实验旨在测试的政策或治疗方法,他们也往往对实验持怀疑态度.

请考虑进行一项旨在测试两项政策(称为政策A和政策B)的实验,其中A和B本身并不令人反感.从现在开始为所有人推出新的政策A听起来像是个好主意,或者至少一个不太可能造成任何伤害的主意.策略B产生了类似的直觉.也许人们甚至认为A和B都是好主意!但是,如果我们不确定A或B是否会起作用,或者A是否可能比B更有效,那么最合理,最科学的下一步就是通过实验比较它们的有效性.

我们的研究发现,尽管采用了这种合理且基于证据的逻辑,但即使这些人赞成应该被测试的两项政策,他们还是倾向于反对RCT和A/B测试.当人们赞成两种政策,但反对设计用来比较它们的实验时,就会发生这种结果,我们称之为"A/B效应".

医院安全检查清单方案

为说明起见,假设有三家医院遇到相同的问题:将导管插入静脉时可能导致危险的感染.这三家医院的负责人都知道这是一个问题,但幸运的是,他们还知道,向医疗专业人员提供安全执行该程序的步骤清单可以将这些感染减少近50%.那么,这些医院应该如何在医生面前获得这些安全检查表?每家医院都提出一个主意:

医院1的研究人员将给所有医生一个安全检查表的小巧印刷版,他们可以将其附加在胸卡上.然后,在执行导尿手术时,这些医生只要忘记了一步,就可以简单地抬起并阅读他们的徽章. (这是策略A).

医院2研究人员将在执行该程序的所有房间内挂海报.这些海报显示安全检查表,以便可能需要提醒的医生可以瞥一眼墙上以记住下一步的工作. (这是策略B).

医院3研究人员同时考虑了这两种想法,并想知道哪一种最好.他们决定进行一项实验,随机分配一半的患者在医生佩戴其证件上清单的房间进行手术.另一半需要该程序的患者将在房间里将检查表挂在墙上进行检查.一年后,医院的研究人员将查看数据并永久采用死亡率最低的任何政策. (这是A/B测试).

在这三种情况中的每种情况下做出的决策是否合适?三百名研究参与者阅读并考虑了类似的情况,然后才以1(非常不合适)至5(非常合适)的等级对每个决策的适当性进行评分.

结果

Patrick Heck
反对政策A,政策B和实验(A/B测试)的人数百分比.
来源:Patrick Heck

图1显示了结果:大约有13%的人反对医院1的徽章政策(通过对它的评分或有些不适当),而只有约5%的人反对医院2的张贴者政策,而超过30%的人反对参与者反对3号医院决定将A与B进行比较.尽管大多数人认为徽章和张贴者的政策是适当的,但仍有惊人的数字认为进行随机实验以了解哪种政策可以挽救更多生命是不合适的. >

我们在其他四个方案中发现了相似的结果,包括比较药物有效性试验;员工退休计划产品;直接面向消费者的基因检测中的披露政策;和自动驾驶汽车的开发(尽管在这种情况下效果明显较弱).

要点

我们从这项研究中学到了什么?有几个重要的要点.

首先,很明显,许多人对实验都怀有道德上的厌恶,即使明确设计实验来测试同一个人认为适当的两种政策或待遇也是如此.这可能会引起对数据收集和学习感兴趣的领导者,研究人员或决策者与组织中的消费者,患者和其他利益相关者之间的摩擦.

第二,这种厌恶无法用关于我们的研究进行或分析的特质决定来解释-我们已经使用不同的研究设计,方法和样本人群(包括大量的医生,护士,和其他医疗专业人员).

第三,我们在这里(以及我们在该主题的最后一篇论文中)观察到,没有一致的人口统计学预测因素表明人们对实验的态度:性别,年龄,种族/民族,家庭收入和教育无法解释或预测A/B效果.我们甚至比较了在STEM领域拥有学位的参与者和没有在STEM领域具有学位且没有发现A/B考试等级差异的参与者之间的结果.

最后,需要指出的是,有很多理由反对某些实验,而不是每个人都反对所有实验.除了对每个决策的适当性进行评分外,我们还要求参与者对这三个决策从最佳到最坏的顺序进行排序.这项措施揭示了一些新的东西:在某些情况下,参与者实际上将A/B测试列为三者中最佳的决定.这一令人鼓舞的结果表明,在某些情况下,人们更喜欢从实验中学习.识别其中一些情况是研究对实验,政策和证据的态度的重要未来方向.

参考

美国国家科学院院刊. 在线优先.

Meyer,MN,Heck,PR,Holtzman,GS,Anderson,SM,Cai,W. ,瓦特,DJ和Chabris,C.F.(2019年).反对比较两种无异议政策或待遇的实验.美国国家科学院院刊,116(22),10723-10728.

                                               

大众心理健康网(www.dzxl120.com)
本文链接:https://www.dzxl120.com/post/19178.html

0
订阅评论
提醒
0 评论
内联反馈
查看所有评论