摘要导读
最近医学权威期刊JAMA发布了一篇关于医学文献中P值运用演化的文章,研究者对P值的使用和滥用进行了广泛的讨论,为了评估在过去25年中生物医学文献的摘要和全文中大规模P值的使用,并探究除P值外其他统计信息出现的频率进行的一项研究。在生物医学和其他学科的许多研究领域使用的统计测试方法,报告对研究结果的推论。研究人员发现,因为p值常被误用,对p值使用的增多并不代表生物医学研究或数据分析水平的提高。研究人员通常对p值的使用技术不佳,用有偏见的方式使用,因此变得非常具有误导性。p值的普遍滥用--经常给可信的研究带来错误--逐渐在学术界变为一件尴尬的事情,包心理学和生物医学等领域。
研究目的本研究的目的是评估生物医学文献在过去25年的报告,评估P值的发展,使用和报告P值随着时间的推移,在整体的生物医学文献,并在特定类型的文章,并确定如何经常统计信息和P值。
研究方法1.通过自动文本采集的方式分析了文献中P值的报道
2.评估特定类别的文章,为了避免结果的重叠,在临床试验中排除类数据的随机临床试验,并在评论分类数据排除Meta分析。
3.针对特殊P值进行主要评价分析
4.随机样本深入人工评估
成果分析文本采集识别到1??篇MEDLINE摘要中有4??个P值,?篇PMC中有3??个P值。P值在摘要中的报道从年的7.3%上升到了年的15.6%。P值的报道率分别是个临床核心期刊(n?=?29?篇摘要)中的33.0%,meta分析(n?=?)35.7%,临床试验(n?=?)38.9%,随机对照实验(n?=?13?)54.5%,综述(n?=?71?)2.4%。P值在摘要和全文中的分布都高度集中在0.05和0.或更小。随着时间的推移,“最好”(最显著)P值报道略小,“坏”(至少有统计学意义)P值报道意义不显著。在MEDLINE摘要和PMC全文中P值的报道,有96%报道了至少有1个P值小于0.05或者更低。人工评估的个摘要中,篇报道的是经验性数据,15.7%的摘要(/[95%CI,13.2%-18.4%])报道了P值,可信区间2.3%(18/[95%CI,1.3%-3.6%]),Bayes因子0%(0/[95%CI,0%-0.5%]),效应量13.9%(/[95%CI,11.6%-16.5%]),其他信息估计P值为12.4%(99/[95%CI,10.2%-14.9%]),统计意义的定性陈述为18.1%(/[95%CI,15.8%-20.6%]);只有1.8%(14/[95%CI,1.0%-2.9%])的摘要报道了至少1个Bayes因子和可信区间。99篇人工提取的全文数据中,55篇报道了P值,4篇为所有效应量提供了置信区间,都没有使用贝叶斯方法,1个使用了错误的发现率,3篇使用了样本大小/功率的计算,5篇指定了主要结局。研究小组从数百万生物医学文章摘要中统计得出,p值的报导从年的7.3%上升到年的15.6%。医学核心期刊文章摘要中有33%使用p值,而随机对照临床试验的一部分中,这个数据竟达到将近55%。
结论在这个P值分析文献中,随着时间的推移,更多的MEDLINE摘要和PMC文章报道了P值,几乎所有的摘要和文章中的P值都报道了有统计学意义的结果,而在亚组分析中,几乎没有文章包含置信区间,Bayes因子或效应量。除了报道孤立的P值外,文献中应包括效应量和不确定性的量。因此,应该避免这种孤立的定性陈述。默认情况下,分离报告P值也应该避免,除非有说服力的论点是,规模效应是不相关的(例如,在一些基因组研究)。此外,期刊应鼓励调查人员在他们的论文中报告定量研究的结果及其文章主要分析,而不是那些名义上有统计学意义的结果。
P值的含义P值是用来说明一个基本统计学问题。假设一个临床试验比较两种药物的治疗效果,药物A似乎比药物比的疗效高10%。这可能是因为药物A确实更有效10%。或者在那次试验中让药物A显得更加有效。简单来说,是药物A幸运而已。那你怎么知道到底是哪种情况?
P值评估的是由于零假设是真,还得来这样的数据的可能性有多大--在这个例子中,零假设为真即药物A和B的药效没有区别。所以举例来讲,如果药物A和B的药效相同,而你进行研究比较它们,得到p值是0.05,意思就是说药物A有5%的可能性比药物B的药效强10%或更多。
P值的确切定义是,该小组研究人员Ioannidis说,如果零假设是正确的,观察到这次实验结果或一些更好结果的可能性。不幸的是,许多研究人员都误以为p值代表零假设不正确的可能性或结果是真实的可能性。
P值真相
P值并不是告诉你某些事情是否是真实的。如果你得到的p值为0.01,意思并不是说某些东西不真实的可能性有1%,Ioannids补充说,p值为0.01可以代表结果20%的真实性、80%的真实性或者0.1%的真实性--所有这些都可以有相同的p值。仅仅p值本身并不能告诉你结果的真实性。如果想真正评估结果的真伪性,应该用错误发现率和贝叶斯因子计算。
本版责任编辑郑小编
参考文献
EvolutionofReportingPValuesintheBiomedicalLiterature,-,JAMA.;(11):-.doi:10.1/jama...
Misleadingp-valuesshowingupmoreofteninbiomedicaljournalarticles
预览时标签不可点收录于话题#个上一篇下一篇