In meinem letzten Blogbeitrag haben wir das Feedback besprochen, das die FDA bei der Veröffentlichung ihrer Federal Register Notice zum neuen CDISC-Standard Dataset-JSON v1.1 erhalten hat. Einer der hervorstechendsten Punkte war die Meinungsverschiedenheit bezüglich der Bereitschaft von Tools. Im heutigen Beitrag möchte ich dieses Thema daher etwas näher beleuchten.
CDISC-Hackathon-Werkzeuge
Die erste Reihe von Tools, auf die ich aufmerksam wurde, waren die Ergebnisse verschiedener CDISC-Hackathons. Der erste Hackathon fand im Jahr 2022 statt und es wurden verschiedene Tools entwickelt, darunter auch Technologien zur Dateikonvertierung von und nach xpt. Der zweite Hackathon war jedoch konzentrierter und zielte darauf ab, einen Entwurf für eine API-Spezifikation für Dataset-JSON zu erstellen. Der dritte Hackathon konzentrierte sich auf die Entwicklung von Dataset-JSON-Viewern. Sieben starke Viewer-Anwendungen wurden eingereicht, wobei der siegreiche Beitrag - VDEDataset Viewer von Dmitry Kolosov - für seine Benutzerfreundlichkeit, Leistung und erweiterten Funktionen gelobt wurde. Ich persönlich habe den VDE Dataset Viewer verwendet, um die Aktualisierungen von Submit™ zur Erzeugung von Dataset-JSON v1.1 zu testen.
Dies sind zwar großartige Ressourcen für die Industrie, aber mit meiner nicht-klinischen Scheuklappe sind sie nur begrenzt brauchbar, da es sich um Open-Source-Tools auf GitHub handelt, die nicht unterstützt werden und nicht validiert sind. In der nicht-klinischen Welt bevorzugen wir vollständig kommerziell verfügbare, unterstützte, validierte Tools von vertrauenswürdigen Anbietern in diesem Bereich.
Wenn JSON nicht einfach JSON ist
Wie jeder, der bereits mit Dataset-JSON v1.1 gearbeitet hat, bestätigen kann, handelt es sich nicht um ein einziges neues Dateiformat. Der Standard sieht die Verwendung von JSON und NDJSON als Dateitypen vor. JSON (JavaScript Object Notation) ist ein Standardformat für strukturierte Daten unter Verwendung von Objekten und Arrays, während NDJSON (Newline-Delimited JSON) ein Format ist, bei dem jede Zeile ein separates, gültiges JSON-Objekt ist - ideal für das Streaming großer Datensätze. Weder CDISC noch FDA haben eine Präferenz zwischen diesen Dateiformaten angegeben, und es ist unklar, ob kommerziell erhältliche Tools beide unterstützen oder mit einem bestimmten Format besser funktionieren. Darüber hinaus hat CDISC kürzlich die CDISC Compressed Dataset-JSON Specification v1.0 veröffentlicht, die einen weiteren Dateityp unterstützt: Komprimiertes JSON. Komprimiertes JSON bezieht sich auf JSON-Daten, deren Größe mit Hilfe von Komprimierungsalgorithmen reduziert wurde, wodurch sie schneller übertragen und gespeichert werden können. XML4Pharma hat ein Open-Source-Tool namens Dataset-JSON Converter entwickelt, das eine einfache Konvertierung zwischen JSON, NDJSON und komprimiertem JSON ermöglicht.
Submit™: Betatest
Wir haben kürzlich eine Beta-Testversion von Submit™ v5.3 für unsere Kunden zur Verfügung gestellt, die an einem Testprogramm teilnehmen wollten. Diese Version von Submit enthält Funktionen zur Generierung von SEND in Dataset-JSON v1.1 aus:
- Provantis
- SENDEN XPT
- Beliebige Excel-, CSV- oder ähnliche flache Dateien mit Daten
- Oder eine beliebige Kombination der oben genannten Punkte
Es unterstützt auch die Erzeugung von SEND XPT aus Dataset-JSON für die Abwärtskompatibilität mit Systemen, die Dataset-JSON noch nicht unterstützen.
Alle bestehenden Funktionen, wie die Anwendung kontrollierter Terminologie, die Anwendung vordefinierter Bearbeitungsregeln und ähnliches, wurden für Dataset-JSON v1.1 vollständig unterstützt.
Die Kunden, die an dem Betatest teilgenommen haben, waren beeindruckt, wie nahtlos wir diesen neuen Ausgabestandard integriert haben. Sie waren dankbar für die Möglichkeit, mit Dataset-JSON zu experimentieren, während die FDA um Feedback bat. Sie waren dankbar dafür, wie schnell wir auf die Federal Register Notice reagieren und ihnen Software zur Verfügung stellen konnten.
Mehrere unserer Kunden haben die Ausgabe mit Pinnacle 21 in der Version 4.1.0 durchgeführt. Diese Version sollte eine gewisse Kompatibilität mit Dataset-JSON aufweisen, wurde jedoch über sechs Monate vor der Fertigstellung von Dataset-JSON v1.1 veröffentlicht, und unsere Kunden stellten fest, dass sie zu diesem Zeitpunkt noch nicht für Dataset-JSON v1.1 bereit war. Ich bin sicher, dass dies in Zukunft korrigiert wird.
Submit™: Jenseits von Betatests
Nach dem erfolgreichen Beta-Test für die Generierung von Dataset-JSON-Dateien haben wir nun volle Unterstützung für Dataset-JSON across integriert:
- SENDView - unser Tool zur Anzeige und Qualitätsprüfung von SEND-Datensätzen
- DefineNow - unser Tool zur automatischen Generierung der Datei define.xml auf der Grundlage der Daten aus den SEND-Datensätzen
- GuidePro - unser Tool zur automatischen Erstellung des nSDRG-Dokuments auf der Grundlage von Daten aus den SEND-Datensätzen
Diese Funktionalität wird unseren Kunden ab 2026 in der Produktion zur Verfügung stehen.
Schlussfolgerung
Es gibt eine Vielzahl von Tools, von Open-Source-Lösungen, die auf Hackathons entwickelt wurden, bis hin zu validierten und unterstützten Angeboten von langjährigen Anbietern aus der Branche. Die größte Unbekannte ist derzeit der Zeitpunkt und die Strategie, die die FDA anwenden wird, um Dataset-JSON v1.1 zu fordern, aber ich glaube, dass unsere nichtklinische Industrie in einer guten Position ist, egal wie und wann dies geschieht.
bis zum nächsten Mal
Marc

