"SENDは研究報告書を電子的に表現したものに過ぎない"
これは私の口癖だった。実際に信じていた。数年前までは世界がそう見えた。私はその言葉を信じていた。
コンセプトは立派だが、現実はどんどん遠ざかっているようだ。その意図は、研究結果を電子的に交換するために、業界が標準化された表現方法を持つことであった。データは通常通り収集され、報告書が作成される。唯一の変更点は、研究報告書がデータを含む対応するファイルを持つようになったことである。
だから、"SENDは研究報告書の電子版に過ぎない"というのが私の口癖だった。ああ、なんてナイーブなんだろう。世界はそんな単純な場所に思えたに違いない。
今日、あるCROがSEND 3.1のデータ収集方法を変更したため、SEND 3.0の作成を拒否しているという話を聞いた。SENDの標準だけでなく、SENDの特定のバージョンがデータの収集方法を決めるという考えに、若い頃の自分は憤慨していただろう。
しかし、現在我々が置かれている状況を考えると、様々な理由から、これはかなり合理的であると私は理解している。おそらく主なものは、SEND3.1で導入された組織病理学データに対する大幅な変更であろう。ある試験から別の試験への顕微鏡所見をよりよく比較できるようにする動きの一環として、SEND3.1では管理用語とHisto所見のかなり厳密な仕様が導入された。もしこれらのデータがSEND3.1互換の用語集を使用して収集されなかった場合、データをSENDに遡及的に変換することは困難を引き起こすだろう。よくても時間がかかり、最悪の場合、病理医が手元にいなければ、すべての所見を解き明かすことは不可能に近い。
検討に値するもう一つの点は、報告書とSENDデータセットが常に一致することを望んでいるわけではないという考えである。「SENDのデータが調査報告書のデータと違うというのですか?と若い頃の自分が恐る恐る尋ねるのを聞く。まあ、実際にはそうなのだが。あるページのデータが、そのページに最も合うようにフィルタリングされたり、フォーマットされたり、あるいは要約されたりすることがある。SENDデータセットにはそのような制約はない。この考え方は今週も出てきた。被験者を観察し、スペースを節約するために異常値だけをレポートに記載することがある。報告書にはそのことを説明する一行も含まれる。しかし、SENDデータセットでは、すべてのレコードが表示されるはずであり、データの利用者は、自分の望むように、自分のツールを使ってそれらをフィルタリングすることができる。
同じ原理が、長期的な調査における食物消費量のようなものにも当てはまり、それは毎日収集されるかもしれないが、毎週報告されるかもしれない。つまり、このページのデータは、SENDのデータよりも少し高いレベルで要約されている可能性がある。
ここで取り上げた例はおそらく最も明白なものだろうが、他にもたくさんある。
こうして今、かつての自分の意見の甘さを振り返っている。概念的には、「SENDは研究報告書を電子的に表現したものに過ぎない」という考え方にはまだ真実味がある。しかし、細部に踏み込めば、この考え方には多くの例外があり、その考え方そのものが時には茶番に思えることもある。
いつものように、この問題についてのあなたの考えをメールinstem)で私に送ってほしい。賛成でも反対でも、あるいは私がいったい何をゴチャゴチャ言っているのか不思議でも構わない。
どうやっていいジョークを書くんだ?"と聞かれたら、"そうだな、笑いから入って逆算するんだ!"と答える。それ自体は安っぽいギャグだが、そこには教訓がある:終わりを意識して始めること。その終わりとは、かつては調査報告書であったが、今日ではSENDデータセットでもある。
また次回まで、
マルク


