Auf Wiedersehen XPT-Dateien, hallo Dataset-JSON!

Das Thema Dataset-JSON ist schon seit einiger Zeit in aller Munde, und wie jeder verantwortungsbewusste Anbieter haben auch wir die Entwicklung des Standards aufmerksam verfolgt.

Seit ich mit der Arbeit an SEND begonnen habe, gab es Frustration über die Anforderung, SAS-Transportdateien als Dateiformat zu verwenden. Im Laufe der Jahre haben CDISC, PHUSE und FDA versucht, Alternativen zu entwickeln. Erinnert sich jemand an das Experimentieren mit Dataset-XML?

Letztes Jahr hat CDISC Dataset-JSON v1.1 veröffentlicht. Dabei handelt es sich um einen Standard für die Darstellung von CDISC-Standards in JSON (JavaScript Object Notation), einem leichtgewichtigen Datenaustauschformat, das von Maschinen leicht geparst und generiert werden kann und häufig von Systemen zur Datenübertragung verwendet wird. Es behauptet, für den Menschen lesbar zu sein, aber nur insofern, als XPT ein binäres Format ist, was bedeutet, dass zum Lesen/Schreiben von Dateien spezielle Werkzeuge erforderlich sind. JSON-Dateien können z. B. mit einem Texteditor geöffnet werden, aber ich würde sagen, dass sie für Menschen wie Sie oder mich nur dann lesbar sind, wenn wir wirklich wissen, was wir da sehen. Dennoch sind diese Dateien weitaus brauchbarer als die restriktiven XPT-Dateien.

Vor diesem Hintergrund hat die FDA in den letzten Wochen eine Federal Register Notice (FRN) herausgegeben, in der sie die Industrie um Feedback zur möglichen Übernahme von Dataset-JSON v1.1 durch die FDA bittet. Sie bittet insbesondere um Rückmeldungen zu den Auswirkungen auf Werkzeuge. Auch wenn dies in der FRN nicht ausdrücklich erwähnt wird, kann man wohl davon ausgehen, dass die Behörde Dataset-JSON sehr schätzt und es den XPT-Dateien, an die wir seit Jahren gebunden sind, vorziehen würde.

Als führender Anbieter von SEND-Tools und -Diensten wird Dataset-JSON v1.1 natürlich Auswirkungen auf meine Welt haben. Ich freue mich daher sehr, dass die Agentur diese Frage stellt. Es gab schon seit einiger Zeit verschiedene Geräusche rund um Dataset-JSON, und wie jeder verantwortungsbewusste Anbieter haben wir die Entwicklung des Standards genau verfolgt.

Es wurden auch kostenlose Open-Source-Tools und Dienstprogramme entwickelt, um der Industrie zu helfen, mit Dataset-JSON zu experimentieren und sich auf seine Einführung vorzubereiten. All dies hat dazu geführt, dass wir bei Instem in einer wirklich guten Position sind, um Unterstützung für Dataset-JSON zu implementieren. Zumindest für uns und unsere Kunden werden also rechtzeitig Werkzeuge für alle FDA-Anforderungen an dieses Dateiformat zur Verfügung stehen.

Wenn Sie sich für die technischen Details interessieren, ist es erwähnenswert, dass der Dataset-JSON v1.1 Standard 2 verschiedene Dateiformate unterstützt:

  • .json
  • .ndjson

Der Unterschied besteht darin, dass es sich bei .ndjson um Newline-Delimited JSON (auch bekannt als JSON Lines) handelt, das sich viel besser für das Streaming von Daten eignet.

Müssten alle Tools beide Dateiformate unterstützen, oder würde die FDA nur das eine und nicht das andere verlangen? Was ist, wenn eine andere Behörde oder ein anderes Konsortium SEND einführt, aber die andere Variante von Dataset-JSON bevorzugt?

Das sind die Fragen, die mich beschäftigen. Mein unmittelbarer Fokus liegt jedoch darauf, sicherzustellen, dass alle unsere Werkzeuge und Dienste vollständig mit Dataset-JSON v1.1 konform sind, und zwar lange vor der Annahme durch die Regulierungsbehörden.

Wenn Sie der FDA eine Rückmeldung geben möchten, finden Sie hier die Federal Register Notice: Federal Register Notice.


Bis zum nächsten Mal,
-Marc

Marc Ellison

Marc Ellison ist der Direktor von SEND Solutions bei Instem und seit 12 Jahren ehrenamtlicher CDISC-Mitarbeiter. Er verfügt über drei Jahrzehnte Erfahrung in der Entwicklung von nicht-klinischer Software und in der Zusammenarbeit mit Forschern bei der optimalen Erfassung und Organisation ihrer Daten. Marc bezeichnet sich selbst als "SEND-Nerd" und interessiert sich leidenschaftlich für die Konzepte, Debatten und Entwicklungen rund um den SEND-Standard. Als starker Verfechter der Bedeutung von SEND für die Beschleunigung der Forschung hat Marc bei Instem einen eigenen Blog mit dem Titel "Sensible SEND" ins Leben gerufen, um Forscher mit aktuellen Details und Erklärungen zu dem sich ständig weiterentwickelnden Prozess zu informieren und vorzubereiten.

Diesen Artikel teilen

Auf dem Laufenden bleiben

Holen Sie sich Expertentipps, Branchennachrichten und aktuelle Inhalte direkt in Ihren Posteingang.

Heute eine Demo anfordern

Sie wissen nicht, welches Produkt Sie wählen sollen? Wählen Sie im Formular "Sonstiges" aus und teilen Sie uns im Nachrichtenfeld Ihre Forschungsziele mit. Unsere Experten werden Ihnen eine Lösung empfehlen.