D'abord, un peu de contexte...
Si la FDA n'avait pas exigé des ensembles de données SEND, nous n'aurions pas assisté à l'adoption et à la mise en œuvre de la norme dans l'ensemble du secteur. Le changement opéré par l'industrie continue de me fasciner, tant en termes de rapidité que d'ampleur.
Cette volonté de soumission nous fournit une norme bien définie, qui convient parfaitement à l'examen d'une seule étude. Toutefois, il devient de plus en plus évident qu'elle présente certaines lacunes pour l'analyse d'études croisées et l'exploration de données. La raison en est que, si SEND permet une représentation précise des résultats d'une étude sous forme électronique, lisible par une machine, il permet également une variabilité significative d'une étude à l'autre.
Maintenant que j'ai planté le décor, j'aimerais parler d'un document récent rédigé par le groupe de travail SEND de l'Association japonaise des fabricants de produits pharmaceutiques (JPMA). Ce document décrit l'analyse qu'ils ont faite de plusieurs paquets SEND provenant de divers fournisseurs. Il détaille les principaux domaines de variabilité dans la façon dont les données sont représentées d'une étude à l'autre. Si l'exploration de données et l'analyse d'études croisées vous donnent des frissons le matin de Noël, je vous recommande vivement de vous plonger dans ce document. Il contient des résultats très détaillés, mettant en évidence des éléments tels que les variables spécifiques les plus susceptibles de varier d'un fournisseur à l'autre.
L'un des principaux domaines abordés dans le document est la portée et l'application de la terminologie contrôlée (TC) de SEND. Les personnes qui travaillent régulièrement avec des ensembles de données SEND ne seront pas surprises d'apprendre que la CT n'est pas définie pour de nombreuses variables clés. Elles permettent une description en texte libre. Le document cite de nombreux exemples, notamment les signes cliniques, pour lesquels même des variables telles que le nom du test et la gravité ne sont pas contrôlées.
S'éloignant des signes cliniques, la discussion sur les TC m'a rappelé les travaux menés par PHUSE concernant l'absence de TC pour le véhicule utilisé dans le cadre de l'étude. Si, pour l'analyse d'une seule étude, une description en texte libre est parfaitement adéquate, lorsqu'il s'agit d'exploration de données, l'absence de CT s'avère problématique. Pour cette question spécifique, PHUSE recommande l'utilisation d'une structure, d'un format et d'une nomenclature particuliers pour décrire le véhicule.
De telles recommandations, visant à appliquer des règles supplémentaires et une normalisation - essentiellement, un TC supplémentaire en plus du TC SEND normal - ajoutent de la complexité à la création d'ensembles de données SEND. Cette complexité augmentera le temps et le coût de production des ensembles de données SEND. Cette discussion ouvrira un autre débat, que je laisserai pour un autre jour.
Il suffit de dire que SEND fournit une représentation précise des résultats d'une étude sous forme électronique, bien adaptée à l'examen d'une seule étude. Il présente toutefois des lacunes en ce qui concerne l'utilisation d'études multiples, mais celles-ci peuvent être surmontées. Le document de la JPMA fait un très bon travail en mettant en évidence les problèmes à résoudre.
Comme d'habitude, n'hésitez pas à m'envoyer un message si vous souhaitez en discuter plus avant.
Jusqu'à la prochaine fois,
Marc