再见 XPT 文件,你好 Dataset-JSON!

关于 Dataset-JSON 的讨论已经有一段时间了,因此,像其他负责任的供应商一样,我们一直在密切关注该标准的发展。

自从我开始研究 SEND 以来,就一直对使用 SAS 传输文件作为文件格式的要求感到不满。多年来,CDISC、PHUSE 和 FDA 都在尝试推进替代方案。有人还记得使用 Dataset -XML 进行的实验吗?

去年,CDISC 发布了 Dataset-JSON v1.1。这是一种用 JSON(JavaScript Object Notation,JavaScript 对象符号)表示 CDISC 标准的标准,JSON 是一种轻量级数据交换格式,便于机器解析和生成,通常被系统用于传输数据。它声称是人类可读的,但也仅限于此,因为 XPT 是一种二进制格式,这意味着需要专业工具才能读/写文件。JSON 文件可以用文本编辑器等工具打开,但我认为,只有像你我这样的人类知道我们在看什么,才能读懂它们。不过,这些文件还是比限制性的 XPT 文件好用得多。

在此背景下,就在过去几周内,FDA 发布了联邦登记公告 (FRN),就 FDA 可能采用 Dataset-JSON v1.1 征求业界的反馈意见。他们特别询问了有关对工具影响的反馈意见。虽然 FRN 没有明确说明,但我认为可以合理地推测,该机构热衷于 Dataset-JSON,并希望它优于我们使用多年的 XPT 文件。

作为 SEND 工具和服务的领先厂商和供应商,Dataset-JSON v1.1 显然会影响我的世界。因此,我很高兴看到该机构提出这个问题。一段时间以来,围绕 Dataset-JSON 的各种声音不绝于耳,因此,与其他负责任的供应商一样,我们一直在密切关注该标准的发展。

此外,我们还开发了一些免费的开源工具和实用程序,帮助业界尝试使用 Dataset-JSON,并为其采用做好准备。所有这些都意味着,在Instem,我们处于一个非常有利的位置,能够实现对 Dataset-JSON 的支持。因此,至少对于我们和我们的客户来说,FDA 对这种文件格式的任何要求都可以及时获得相关工具。

如果你对技术细节感兴趣,值得一提的是,Dataset-JSON v1.1 标准实际上支持两种不同的文件格式:

  • .json
  • .ndjson

不同的是,.ndjson 是以新行分隔的 JSON(也称为 JSON 行),更适用于流式数据。

是所有工具都需要支持这两种文件格式,还是 FDA 只需要其中一种而不需要另一种?如果不同的监管机构或联盟采用 SEND,但又偏爱另一种数据集-JSON 格式,该怎么办?

这些都是我担心的问题。不过,我的当务之急是确保我们的所有工具和服务在监管机构采用 Dataset-JSON v1.1 之前完全符合该标准。

如果您想向 FDA 提供反馈意见,请参阅联邦登记通告:联邦登记公告


下次再见,
-Marc

马克-埃里森

Marc Ellison 是Instem 公司 SEND 解决方案总监,担任 CDISC 志愿者已有 12 年。他在创建非临床软件以及与研究人员一起研究如何以最佳方式收集和组织数据方面拥有 30 年的经验。 Marc 自称为 "SEND 书呆子",对围绕 SEND 标准的概念、争论和演变充满热情。作为 SEND 在加速研究方面重要性的坚定倡导者,Marc 在Instem 开设了自己的教育博客 "Sensible SEND",帮助研究人员了解和准备有关不断发展的过程的前沿细节和解释。

分享本文