好吧,先说说来龙去脉...
如果没有 FDA 要求 SEND 数据集,我们就不会看到全行业采用和实施该标准。从速度和规模两方面来看,业界的变革仍然令我着迷。
这种提交的驱动力为我们提供了一个定义明确的标准,也是一个非常适合单一研究审查的标准。然而,越来越明显的是,交叉研究分析和数据挖掘存在一些缺陷。究其原因,虽然 SEND 允许以电子、机器可读的形式准确呈现研究结果,但它也允许不同研究之间存在很大的差异。
现在,我想讨论一下日本制药商协会 (JPMA) SEND 工作组最近发表的一篇论文。这篇文章介绍了他们对来自不同供应商的多个 SEND 数据包进行的分析。它详细介绍了不同研究中数据表示方式存在差异的关键领域。如果数据挖掘和交叉研究分析让你像圣诞节早晨的孩子一样兴奋,那么我强烈建议你亲自深入研究一下这篇论文。它包含了非常详细的结果,指出了最容易在不同提供商之间产生差异的特定变量。
本文讨论的关键领域之一是 SEND 受控术语 (CT) 的范围和应用。对于经常使用 SEND 数据集的人来说,许多关键变量没有 CT 定义并不奇怪。它们允许自由文本描述。该文件列举了许多例子,包括临床体征,其中甚至连测试名称和严重程度等变量都没有控制。
离开《临床征象》,关于 CT 的讨论让我想起 PHUSE 正在开展的工作,即研究中使用的车辆缺乏 CT。虽然对于单项研究分析来说,自由文本描述已经完全足够,但在数据挖掘时,缺乏 CT 会造成问题。针对这一具体问题,PHUSE 建议使用特定的结构、格式和术语来描述车辆。
这些建议旨在执行补充规则和标准化--本质上是在常规 SEND CT 之外进一步增加 CT--增加了创建 SEND 数据集的复杂性。这种复杂性将增加制作 SEND 数据集的时间和成本。这一讨论将引发另一场辩论,我将留待以后再讨论。
可以说,SEND 以电子形式准确呈现了一项研究的结果,非常适合单项研究的审查。不过,在多研究使用方面还存在一些不足,但这些都是可以克服的。JPMA 的论文很好地指出了这些需要解决的问题。
和往常一样,如果您想进一步讨论这个问题,请给我留言。
下次再见
马克