Seit ich mit der Arbeit an SEND begonnen habe, gab es Frustration über die Anforderung, SAS-Transportdateien als Dateiformat zu verwenden. Im Laufe der Jahre haben CDISC, PHUSE und FDA versucht, Alternativen zu entwickeln. Erinnert sich jemand an das Experimentieren mit Dataset-XML?
Letztes Jahr hat CDISC Dataset-JSON v1.1 veröffentlicht. Dabei handelt es sich um einen Standard für die Darstellung von CDISC-Standards in JSON (JavaScript Object Notation), einem leichtgewichtigen Datenaustauschformat, das von Maschinen leicht geparst und generiert werden kann und häufig von Systemen zur Datenübertragung verwendet wird. Es behauptet, für den Menschen lesbar zu sein, aber nur insofern, als XPT ein binäres Format ist, was bedeutet, dass zum Lesen/Schreiben von Dateien spezielle Werkzeuge erforderlich sind. JSON-Dateien können z. B. mit einem Texteditor geöffnet werden, aber ich würde sagen, dass sie für Menschen wie Sie oder mich nur dann lesbar sind, wenn wir wirklich wissen, was wir da sehen. Dennoch sind diese Dateien weitaus brauchbarer als die restriktiven XPT-Dateien.
Vor diesem Hintergrund hat die FDA in den letzten Wochen eine Federal Register Notice (FRN) herausgegeben, in der sie die Industrie um Feedback zur möglichen Übernahme von Dataset-JSON v1.1 durch die FDA bittet. Sie bittet insbesondere um Rückmeldungen zu den Auswirkungen auf Werkzeuge. Auch wenn dies in der FRN nicht ausdrücklich erwähnt wird, kann man wohl davon ausgehen, dass die Behörde Dataset-JSON sehr schätzt und es den XPT-Dateien, an die wir seit Jahren gebunden sind, vorziehen würde.
Als führender Anbieter von SEND-Tools und -Diensten wird Dataset-JSON v1.1 natürlich Auswirkungen auf meine Welt haben. Ich freue mich daher sehr, dass die Agentur diese Frage stellt. Es gab schon seit einiger Zeit verschiedene Geräusche rund um Dataset-JSON, und wie jeder verantwortungsbewusste Anbieter haben wir die Entwicklung des Standards genau verfolgt.
Es wurden auch kostenlose Open-Source-Tools und Dienstprogramme entwickelt, um der Industrie zu helfen, mit Dataset-JSON zu experimentieren und sich auf seine Einführung vorzubereiten. All dies hat dazu geführt, dass wir bei Instem in einer wirklich guten Position sind, um Unterstützung für Dataset-JSON zu implementieren. Zumindest für uns und unsere Kunden werden also rechtzeitig Werkzeuge für alle FDA-Anforderungen an dieses Dateiformat zur Verfügung stehen.
Wenn Sie sich für die technischen Details interessieren, ist es erwähnenswert, dass der Dataset-JSON v1.1 Standard 2 verschiedene Dateiformate unterstützt:
- .json
- .ndjson
Der Unterschied besteht darin, dass es sich bei .ndjson um Newline-Delimited JSON (auch bekannt als JSON Lines) handelt, das sich viel besser für das Streaming von Daten eignet.
Müssten alle Tools beide Dateiformate unterstützen, oder würde die FDA nur das eine und nicht das andere verlangen? Was ist, wenn eine andere Behörde oder ein anderes Konsortium SEND einführt, aber die andere Variante von Dataset-JSON bevorzugt?
Das sind die Fragen, die mich beschäftigen. Mein unmittelbarer Fokus liegt jedoch darauf, sicherzustellen, dass alle unsere Werkzeuge und Dienste vollständig mit Dataset-JSON v1.1 konform sind, und zwar lange vor der Annahme durch die Regulierungsbehörden.
Wenn Sie der FDA eine Rückmeldung geben möchten, finden Sie hier die Federal Register Notice: Federal Register Notice.
Bis zum nächsten Mal,
-Marc