适用于医疗保健专业人员

CC通过开放获取
研究方法与报告

标准2015:报告诊断准确性研究的基本项目的更新列表

BMJ2015351doi:https://doi.org/10.1136/bmj.h5527(发布于2015年10月28日)引用如下:BMJ2015; 351: h5527
  1. 帕特里克·M·博苏伊特1
  2. Johannes B Reitsma2
  3. 大卫·E·布伦斯3.
  4. 康斯坦丁·A·Gatsonis4
  5. Paul P Glasziou5
  6. Les Irwig6
  7. Jeroen G Lijmer7
  8. 大卫·莫赫89
  9. 德拉蒙德兰尼1011
  10. 亨利卡C W德维特12
  11. Herbert Y Kressel1314
  12. 纳德Rifai1516
  13. 罗伯特·M·戈卢布1718
  14. 道格拉斯·G·奥特曼19
  15. Lotty Hooft20.
  16. Daniël Korevaar1
  17. Jérémie F科恩121
  18. 为标准集团服务
  1. 1荷兰阿姆斯特丹大学学术医学中心临床流行病学、生物统计学和生物信息学系
  2. 2荷兰乌得勒支大学乌得勒支大学医学中心朱利叶斯健康科学和初级保健中心
  3. 3.美国弗吉尼亚州夏洛茨维尔市弗吉尼亚大学医学院病理科
  4. 4美国罗德岛州普罗维登斯市布朗大学公共卫生学院统计科学中心
  5. 5澳大利亚昆士兰州黄金海岸邦德大学健康科学和医学系循证实践研究中心
  6. 6筛选和诊断测试评估项目,悉尼大学公共卫生学院,悉尼,新南威尔士,澳大利亚
  7. 7荷兰阿姆斯特丹Onze Lieve Vrouwe Gasthuis精神科
  8. 8临床流行病学项目,渥太华医院研究所,加拿大渥太华
  9. 9渥太华大学流行病学、公共卫生和预防医学学院,渥太华,加拿大
  10. 10同行评审大会,芝加哥,伊利诺伊州,美国
  11. 11Philip R Lee卫生政策研究所,加州大学旧金山分校,美国
  12. 12荷兰阿姆斯特丹自由大学医学中心EMGO卫生保健研究所流行病学和生物统计系
  13. 13美国马萨诸塞州波士顿哈佛医学院贝斯以色列女执事医疗中心放射科
  14. 14放射学编辑部,波士顿,马萨诸塞州,美国
  15. 15美国马萨诸塞州波士顿,哈佛医学院,波士顿儿童医院检验科
  16. 16临床化学编辑部,华盛顿,美国
  17. 17美国伊利诺伊州芝加哥市西北大学范伯格医学院普通内科、老年病学和预防医学系
  18. 18《美国医学会杂志》编辑部,芝加哥,伊利诺伊州,美国
  19. 19英国牛津大学纳菲尔德骨科、风湿病和肌肉骨骼科学系医学统计中心
  20. 20.荷兰科克伦中心,朱利叶斯健康科学和初级保健中心,乌得勒支大学医学中心,乌得勒支大学,乌得勒支,荷兰
  21. 21INSERM UMR 1153和法国巴黎笛卡尔大学AP-HP内克尔医院儿科。
  1. 通信:P M博苏伊特p.m.bossuyt在{}amc.uva.nl
  • 接受2015年9月18日

报告不完整已被确定为生物医学研究中可避免的浪费的一个主要来源。研究报告中往往没有提供基本信息,阻碍了研究的识别、关键评估和复制。为了提高诊断准确性研究的报告质量,制定了报告诊断准确性标准(STARD)声明。在这里,我们提出了2015年标准,一个更新的30个基本项目的清单,应该包括在每一个诊断准确性研究的报告。本次更新纳入了关于偏差来源和诊断准确性可变性的最新证据,旨在促进标准的使用。因此,standard 2015可能有助于提高诊断准确性研究报告的完整性和透明度。

作为研究人员,我们谈论和撰写我们的研究,不仅仅是因为我们对这些发现感到高兴或失望,而且是为了让其他人欣赏我们方法的有效性,让我们的同事能够复制我们所做的工作,并向临床医生、其他卫生保健专业人员和决策者披露我们的发现,所有这些人都依赖强有力的研究结果来指导他们的行动。

不幸的是,在临床医学的几个领域,研究报告的缺陷已经被突出。1研究方法的基本要素通常描述得很差,有时甚至被完全省略,这使得批判性评估和复制都很困难,如果不是不可能的话。有时研究结果被选择性地报道,有时研究人员在解释他们的发现时无法抗拒毫无根据的乐观主义。23.4这些实践限制了研究和任何下游产品或活动的价值,如系统评价和临床实践指南。

医学测试研究报告也不例外。越来越多的评估发现了测试准确性研究报告中的缺陷。5在这些研究中,测试是根据临床参考标准或金标准进行评估的;结果通常被报告为测试的敏感性和特异性的估计值,这表明该测试在正确识别患有目标疾病的患者方面有多好。也可以使用其他准确性统计数据,例如受试者工作特征(ROC)曲线下的面积或正预测值和负预测值。

尽管这些研究表面上很简单,但它们存在偏见的风险。67例如,如果不是所有接受检测的患者都被纳入最终分析,或者仅包括健康对照,则检测准确性的估计值可能无法反映检测在临床应用中的表现。然而,这些关键信息往往在研究报告中缺失。

现在已经确定,敏感性和特异性不是固定的测试特性。假阳性和假阴性测试结果的相对数量在不同的环境下有所不同,这取决于患者的表现方式以及他们已经进行了哪些测试。不幸的是,许多作者也没有完整地报告临床背景,以及他们何时、何地、如何确定和招募合格的研究参与者。8此外,敏感性和特异性估计可能会有所不同,因为与试验比较的参考标准的变量定义不同。因此,这些信息应该在研究报告中提供。

2003年标准声明

为了帮助报告诊断准确性研究的完整性和透明度,一组研究人员、编辑和其他利益相关者制定了每个研究报告中应包括的基本项目的最低清单。开发清单的指导原则是选择项目,如果进行描述,将有助于读者判断研究中可能存在的偏差,并评估研究结果的适用性以及作者结论和建议的有效性。

由此产生的诊断准确性报告标准(STARD)声明于2003年发表在20多家期刊上。9另外几份出版物还附有社论和评论,并得到更多出版物的赞同。

自STARD出版以来,一些评估指出了报告准确性研究的微小但具有统计学意义的改进(平均增加1.4项(95%置信区间0.7至2.2))。510渐渐地,报告了更多的基本项目,但情况仍远不是最理想的。

标准2015的开发方法

标准指导委员会定期审查潜在相关研究的文献,以告知可能的更新。2013年,指导委员会认为是时候更新清单了。

更新有两个主要目标:首先,纳入关于偏差来源、适用性问题和在测试准确性研究中促进慷慨解释的因素的最新证据,其次,使列表更易于使用。在进行修改时,我们还考虑了与其他报告指南的协调,如2010年报告试验综合标准(CONSORT)。11

关于更新过程的完整描述和更改的理由可在“提高卫生研究的质量和透明度”(EQUATOR)网站上找到www.equator-network.org/reporting-guidelines/stard.简而言之,我们邀请了2003 standard小组成员参与更新过程,提名新成员,并对更新的一般范围进行评论。联系了建议的新成员。因此,标准小组现在已经发展到85名成员,其中包括研究人员、编辑、记者、证据合成专业人员、资助者和其他利益相关者。

然后,standard小组成员被要求在两轮基于网络的调查中提出建议,并随后认可所提出的变化。指导委员会于2014年9月在阿姆斯特丹举行了为期两天的会议,并就此起草了一份基本项目清单草案。然后,该列表在不同的小组中进行试点:初级和高级研究人员、同行评审人员和编辑。

标准2015的总体结构与标准2003相似。一页纸的文档包含30个条目,按照科学文章的介绍、方法、结果和讨论(IMRAD)结构分组(见表1)).有几个2015标准的项目是相同的,在2003年的版本。其他公司则被改写、合并或(如果复杂的话)拆分。已经添加了一些(见表2)为新项目和表3的摘要对于关键术语)。现在所有的报告都需要一个图表来描述参与者的研究流程(图1)).

表1

2015年标准榜单*

查看该表:
表2

stard2015新项目总结

查看该表:
表3

关键标准术语

查看该表:

范围

标准2015取代了2003年发布的原始版本;请那些想参考标准的人引用这篇文章。基本项目的列表可以被视为一个最小集,而一份信息丰富的研究报告通常会提供更多的信息。然而,我们希望在一份精心准备的诊断准确性研究报告中找到所有适用的项目。

作者被邀请在准备他们的研究报告时使用标准。审稿人可以使用列表来验证所提交的稿件中所有重要信息都是可用的,并在关键项目缺失时提出修改建议。

我们相信在2003年或以后认可标准的期刊会推荐使用这个更新的版本,并鼓励提交的手稿符合标准。我们希望更多的期刊和期刊组织能够推广使用这一和类似的报告指南。资助者和研究机构可以促进或强制要求遵守标准,以实现研究和下游产品或活动的价值最大化。

标准也可能有助于报告其他评估测试性能的研究。这包括预后研究,它可以根据未来是否发生事件对患者进行分类;监测研究,在这些研究中,试验旨在发现或预测不良事件或缺乏反应;评价治疗选择标志物的研究;和更多。我们和其他人发现,在报告和检查此类研究时,大多数标准项目都是有用的,尽管标准主要针对诊断准确性研究。

诊断准确性不是测试性能的唯一表现,也不总是最有意义的。12例如,相对于单个测试,组合测试的增量精度可以提供更多的信息。13对于连续试验,可能并不总是表明将试验分为阳性和阴性。在这种情况下,尽管许多方法上的预防措施是相同的,但表达测试性能所需的计算方法和图形方法是不同的,并且standard可以帮助以一种信息丰富的方式报告研究。其他报告指南针对更具体的测试形式,例如针对多变量预测模型的个体预后或诊断的多变量预测模型的透明报告(TRIPOD)。14

虽然STARD侧重于测试准确性研究的完整研究报告,但在编写会议摘要时,包括试验注册中心的信息,以及为此类研究开发协议时,这些项目也很有帮助。更多的计划正在进行中,为每个应用程序提供更具体的指导。

标准扩展和应用程序

标准声明的设计适用于所有类型的医学测试。标准小组认为,对于所有的诊断准确性研究,一个单一的清单将更广泛地传播,更容易被作者、同行评议者和期刊编辑接受,而不是对不同类型的测试(如成像、生物化学或组织病理学)单独列出清单。

有一个一般的清单可能需要额外的说明,以提供有意义的报告,为特定类型的测试、特定应用或特定形式的分析提供更多的信息。例如,该指南可以描述研究和报告测量不确定度的首选方法,而不改变任何其他标准项目。标准小组欢迎开发这样的标准扩展,并邀请感兴趣的小组在开发它们之前与标准执行委员会联系。

其他小组可能希望制定额外的指南,以促进对特定应用程序使用standard。为病史采集和体检准备了一个这样的标准应用程序的例子。15另一种类型的应用是针对特定目标条件(如痴呆症)使用standard。16

可用性

新的2015年标准清单和所有相关文件可以在赤道网站的标准页面上找到。EQUATOR是一项国际倡议,旨在通过促进透明和准确的报告和更广泛地使用强有力的报告准则,提高已发表的卫生研究文献的价值。1718standard团队相信,与EQUATOR和其他报告准则开发者紧密合作将有助于我们更好地实现共同目标。我们已经更新了2003年的解释和阐述文件,这些文件也可以在EQUATOR网站上找到。本文档解释了每一项的基本原理并给出了示例。

标准列表是在创作共用许可下发布的。这允许每个人使用和分发工作,如果他们承认来源。标准声明最初是用英语报道的,但有几个小组致力于其他语言的翻译。我们欢迎这样的翻译,这些翻译最好是由研究人员团队开发的,采用循环开发过程,并进行回译到原始语言和用户测试。19我们还为“标准”申请了商标,以确保指导委员会拥有独家使用“标准”一词来标识商品或服务的权利。

增加价值,减少浪费

标准指导委员会意识到,建立一个基本项目清单并不足以在报告完整性方面取得实质性的改进,正如2003年清单引入后的适度改进所显示的那样。我们认为这个清单不是最终产品,而是建立更具体的工具的起点,以促进完整和透明的报告,例如为作者提供的清单和写作辅助,为审稿人和编辑提供的工具,教学视频和教学材料,所有这些都基于这个标准的基本项目清单。

报告不完整已被确定为生物医学研究中可避免的浪费的来源之一。1自标准标准启动以来,还开展了其他几项举措,以提高研究的可重复性和提高透明度。20.这其中有多种因素,但不完整的报道是其中之一。我们希望这次标准标准的更新,连同其他实施举措,将帮助作者、编辑、审稿人、读者和决策者收集、评估和应用所需的证据,以加强有关医学检测的决策和建议。最后,作为研究人员、医疗保健专业人员、支付者和患者,我们都将受益于信息更丰富和透明的报告。

笔记

引用如下:BMJ2015; 351: h5527

脚注

  • 本文于2015年10月同时发布英国医学杂志放射学,临床化学.本文基于创作共用CC BY-NC许可发布http://creativecommons.org/licenses/by-nc/4.0

  • STARD集团合作者:Todd Alonzo, Douglas G Altman, Augusto azu阿拉- blanco, Lucas Bachmann, Jeffrey Blume, Patrick M Bossuyt, Isabelle Boutron, David Bruns, Harry Büller, Frank M Bossuyt, Sarah Byron, Stephanie Chang, Jérémie F Cohen, Richelle Cooper, Joris de Groot, Henrica C W de Vet, Jon Deeks, Nandini Dendukuri, Jac Dinnes, Kenneth Fleming, Constantine A Gatsonis, Paul P Glasziou, Robert M Golub, Gordon Guyatt, Carl Heneghan, j orgen Hilden, Lotty Hooft, Rita Horvath, Myriam Hunink, Chris Hyde, John Ioannidis,Les Irwig, Holly Janes, Jos Kleijnen, André Knottnerus, Daniël A Korevaar, Herbert Y Kressel, Stefan Lange, Mariska Leeflang, Jeroen G Lijmer, Sally Lord, Blanca Lumbreras, Petra Macaskill, Erik Magid, Susan Mallett, Matthew McInnes, Barbara McNeil, Matthew McQueen, David Moher, Karel moones, Katie Morris, Reem Mustafa, Nancy Obuchowski, Eleanor Ochodo, Andrew Onderdonk, John Overbeke, Nitika Pai, Rosanna Peeling, Margaret Pepe, Steffen Petersen, Christopher Price, Philippe Ravaud,Johannes B. Reitsma, Drummond Rennie, Nader Rifai, Anne Rutjes, Holger Schunemann, David Simel, Iveta Simera, Nynke Smidt, Ewout Steyerberg, Sharon Straus, William Summerskill, Yemisi Takwoingi, Matthew Thompson, Ann van de Bruel, Hans van Maanen, Andrew Vickers, Gianni Virgili, Stephen Walter, Wim Weber, Marie Westwood, Penny Whiting, Nancy Wilczynski, Andreas Ziegler。

  • 贡献者:所有作者确认对本文的智力内容做出了贡献,并满足以下3个要求:(a)对数据的概念和设计、数据的获取或数据的分析和解释有重大贡献;(二)起草或者修改有关知识内容的条款;(c)发表文章的最终批准。

  • 资金:没有明确的资金用于标准2015的开发。荷兰阿姆斯特丹大学学术医疗中心为标准指导小组的会议提供了部分资金,但对制定或传播基本项目清单没有影响。标准指导小组成员和标准小组成员各自承担额外的个人费用。

  • 利益竞争:所有作者均已完成临床化学作者披露形式:N Rifai为临床化学,协会;C Gatsonisis是RSNA研究发展委员会的成员。

这是一篇根据创作共用署名(CC BY 4.0)许可条款发布的开放获取文章,该许可允许其他人出于商业用途分发、混音、改编和构建此作品,前提是正确引用原始作品。看到的:http://creativecommons.org/licenses/by/4.0/

参考文献

视图抽象
Baidu
map