前回のブログ記事で、FDAが連邦官報告示を発表した際に、新しいCDISC標準Dataset-JSON v1.1に関して受け取ったフィードバックについて述べた。その中で目立ったのは、ツールの準備性に関する意見の違いでした。そこで今日の投稿では、このトピックについてもう少し掘り下げてみようと思います。
CDISCハッカソンツール
私が最初に知ったツール群は、様々なCDISCハッカソンの成果物だった。最初のハッカソンは2022年に開催され、xptからxptへのファイル変換技術を含む様々なツールが開発された。 しかし、2回目のハッカソンはより焦点を絞ったもので、Dataset-JSONのAPI仕様の草案を作成することを目的としていた。第3回ハッカソンは、Dataset-JSONビューアの開発に焦点を当てた。7つの強力なビューア・アプリケーションが提出され、Dmitry Kolosov氏によるVDEDataset Viewerが、その使いやすさ、パフォーマンス、高度な機能を評価され、優勝しました。私は個人的にVDE Dataset Viewerを使用して、Dataset-JSON v1.1を生成するためのSubmit™の更新をテストしました。
これらは産業界にとっては素晴らしいリソースであるが、非臨床の私の目から見ると、GitHub上のオープンソースで、サポートされておらず、検証もされていないツールであるため、使い道は限られている。非臨床の世界では、その分野で信頼できるベンダーが提供する、完全に市販され、サポートされ、検証されたツールを好む。
JSONが単なるJSONでないとき
Dataset-JSON v1.1で作業を始めた人なら誰でもわかると思うが、実はこれは単一の新しいファイル形式ではない。この標準は、ファイルタイプとしてJSONとNDJSONの両方を使うことを呼びかけています。JSON(JavaScript Object Notation)は、オブジェクトと配列を使用した構造化データの標準フォーマットであり、NDJSON(Newline-Delimited JSON)は、各行が個別の有効なJSONオブジェクトであるフォーマットで、大規模なデータセットのストリーミングに最適である。CDISCもFDAも、これらのファイル形式のどちらを優先するかは示しておらず、市販のツールが両方をサポートしているか、あるいは特定のものを使用した方がうまく機能するかは不明である。さらに、CDISCは最近、CDISC Compressed Dataset-JSON Specificationv1.0を発表し、別のファイル形式をサポートした:圧縮JSONである。圧縮JSONとは、圧縮アルゴリズムを使ってサイズを縮小したJSONデータのことで、送信や保存を高速化する。XML4Pharmaは、JSON、NDJSON、圧縮JSONを簡単に変換できるDataset-JSON Converterというオープンソースツールを開発した。
提出™:ベータテスト
最近、Submit™ v5.3のベータテストバージョンを、テストプログラムへの参加に関心のあるお客様に提供しました。このバージョンのSubmit 、Dataset-JSON v1.1からSENDを生成する機能が含まれています:
- Provantis
- XPTを送信
- エクセル、csv、または類似のフラットファイルのデータ
- または上記の組み合わせ
また、Dataset-JSONをまだサポートしていないシステムとの後方互換性のために、Dataset-JSONからSEND XPTを生成することもサポートしている。
統制用語の適用、定義済みの編集ルールの適用など、既存の機能はすべて、Dataset-JSON v1.1で完全にサポートされました。
ベータテストに参加した顧客は、私たちがこの新しい出力標準をいかにシームレスに組み込んだかに感銘を受けました。FDAがフィードバックを求めている間に、Dataset-JSONを試す機会を与えてくれたことに感謝しています。また、連邦官報告示に迅速に対応し、ソフトウェアを提供できたことにも感謝されました。
私たちの顧客の何人かは、バージョン4.1.0を使用してPinnacle 21で出力を実行しました。このバージョンは、Dataset-JSONとある程度の互換性を持つことを意図していましたが、Dataset-JSON v1.1が完成する6ヶ月以上前にリリースされたため、現時点ではDataset-JSON v1.1に対応できていないことがわかりました。これは将来修正されることでしょう。
サブミット™:ベータテストを超えて
Dataset-JSONファイル生成のベータテストが成功した後、Dataset-JSONの完全なサポートが追加されました:
- SENDView - SENDデータセットの閲覧およびQAレビュー用ツール
- DefineNow - SENDデータセットのデータに基づいてdefine.xmlファイルを自動生成するツール
- GuidePro - SENDデータセットにあるデータに基づいてnSDRG文書を自動生成するためのツールです。
この機能は、2026年に顧客が本番で使用できるように配備される予定だ。
結論
ハッカソンで作成されたオープンソースのソリューションから、長年の業界ベンダーが提供する検証されサポートされたものまで、様々なツールがあります。今現在の最大の未知数は、FDAがDataset-JSON v1.1を要求するタイミングと戦略である。
次回まで
マルク