名古屋で行われた第25回日本疫学会で発表してきました。休診にして済みませんでした。
疫学、という学問はどのような因子が我々の生活に影響を与えるかを緻密に考える学問で、医学のみならず、福祉、教育などあらゆる分野に大きな影響を及ぼします。
そのために正確なデータの収集、解析方法の開発の他、大規模なデータの蓄積とその利用が行われています。
医学分野ではこの1年、倫理指針を大きく逸脱した、恥ずかしくも厭わしいいくつかの臨床試験の不正が明らかになり、世間を騒がせています。
さて、私が今回学会に発表するに至った理由はいくつかありますが、
1)医学領域のデータベースのテーブル構造について詳しい医者は珍しいようだ。そのためコンサルティングのようなことをするわけですが、データを集めたい企業の人々や臨床研究をしたい先生方と話すうちに電子カルテのデータの蓄積方法について深く考える機会が多かった。私のようにこうしたデータ処理に詳しい人材は臨床家では稀だけれども、我々が使っている電子カルテダイナミクスのユーザーを見ていると、ユニークなデータ利用を積極的に行っている方々が多く、そうした人々と疫学を専門にされる人々とを結びつけることが出来たら面白い化学反応が起きるのではないか。
2)この時代に研究をしようとすると倫理指針の勉強を避けて通ることは出来ない。医療と福祉の研究はその捉え方は異なるので両方について知っておく必要がある。
もうひとつ、データを利用する側の先生方は、今までは臨床研究や疫学研究をデザインする、あるいはすでにある大規模データを利用して何か因果関係がないかどうかを調べることには慣れていても、今世界で熾烈に覇権争いが行われているEMR(電子的な医療データ)の直接利用には慣れていないので、どのような利用方法があるかを提示しておくことも重要だと考えます。
電子カルテダイナミクスは、「電子カルテの教科書」と言えると思う。実に平易なデータ構造は、ほかにどのようなEMRのデータを見ようとも、それにたじろがないで済む基本的な知識を与えてくれるという点で実に素晴らしいソフトです。という点で私は「ダイナミクス推し」ですから、利益相反にはダイナミクスを入れておきました。少し笑いが出ていました。共同演者はそうそうたる面々です。
さて、日本の医療についていろいろご批判もあろうかと思いますが、「データ収集」という意味で2009年からの5年間の医療データは世界の宝であろうと考えます。かつては(そして今でも一部に残っていますが)まるめ診療というのが大々的に行われていた時代があって、老人にどのような薬が出されていたのか請求書上では一切わからないとか、あるいは200円ルールだとかいうもので、処方がわからない、というような時代があったのです。コスト優先で近い将来また違う意味でのまるめ診療が導入される可能性は当然あるのですが、少なくともそれまでの間はcommon diseaseあるいは生活習慣病でどのような診療が行われているのかを世界が日本をお手本に勉強するチャンスがあるのでは、と思っています。これはアメリカやヨーロッパの先生方と医療データの話をするときにいつも思う事です。代替医療が良くないのは、すべてのログを残さずに「このやり方が良いよ」と主張し、検証を拒否している事でしょう。
ダイナミクスのデータについて話す前に、NDBについてですが、大学の研究者の先生は一定の手続きのもとに2009年以後のレセプト情報を手に入れることが可能です。そしてそれらを使うと今までは出来なかった横断研究も可能になる可能性が出てきます。例えば歯科と医科。
http://www.mhlw.go.jp/stf/shingi/2r98520000025pcd-att/2r98520000026241.pdf
に概要は記載されています。
NDBは観察研究、および個人情報は消されている、ということで患者の同意は必ずしも必要ないと解釈されています。反面かなりの情報が消されています。例えば症状詳記、非コード化病名はわかりません。
なるほど現代的だなと思ったのは、データは圧縮されたままだという事です。「木構造」などというものを数年間に私も勉強しました。圧縮されたままでデータ処理は出来るのです。ものすごいデータ量になるのでしょうね。そうなるとGoogleに就職できるぐらいのスキルが必要になりそうです。だからNDBはあっても一向に研究が出てこないのでしょう。つまり、現時点ではNDBから「この条件でデータをください」とお願いする部分にスキルが必要なんじゃないか、と思います。(この条件ならデータが1GBぐらいでおさまるんじゃないか、などと推測するには我々のような臨床医の勘が必要じゃないか、と思います)一人当たり何バイトになりそうか、などは実際にレセプトを作っている我々じゃないとその勘所がわからないからです。協力してほしいときは言ってほしいと思います。
さて、まったく個人情報が消されているかというとそうではなくて、他病院にかかっている患者さんが追跡できるように、あるいは保険が変わっても追跡できるように、2種類のハッシュ情報が含まれています。ソルト処理をどうしているのか興味深いです。これはダイナミクスで単一の医院内でいろいろ処理するよりも優れていると思います。
どんな電子カルテでも、頭書き、血液検査結果、処方、検査オーダー、手術・処置の情報が格納されている、という点では変わりません。高速に処理するためにはしかしデータ構造そのものがオープンになっていたほうが良いのは言うまでもありません。しかしどのデータも正規化されていないことに注意が必要で、統計処理しやすくするためには演算処理がかなり入ることになります。この部分で苦労している人々に「もっと簡単に出来るじゃん」と茶々を入れるのが自分の仕事、という事になります。
さて、疫学研究では例えば高層階に住んでいるかどうか、街道沿いに住んでいるかなどの住所の情報が必要になる場合があります。それらはNDBに含まれていないので、電子カルテ、あるはレセコンのデータが必要になるでしょう。固定電話なのか、携帯電話なのか、といった情報も患者背景をある程度推測させます。最近引っ越してきた人は固定電話を持っていない人が多いです。あるいは高齢者がいない世帯ではそうです。患者が来院する曜日、時間も疾患によって偏りがあったりします。例えば休み明けには案外重症者が我慢して待っていたりします。我慢しちゃう人はどういう人?というような研究だって可能かもしれません。(コンビニ受診と逆のことをする人々です)他には自賠責・労災の研究はNDBではできませんし、自費診療の研究も出来ません。歯科ではインプラントが自費ですが、これらは長期の予後が検証できない可能性があって非常に危惧しています。
最後に今までデータ処理の相談にかかわってきて一番思っていることであり、マイクロソフトやインテルやグーグルやIBMが血道を上げている部分が、「医療データを正規化する」という事でしょう。例を上に示しました。欧米はディクテーションの世界なので案外うまくいくかもしれません。日本ではだめでしょう。
ダイナミクスにもそのような取り組みはあるのですが、データの入力が義務化されているわけではないのです。そのハードルを飛び越えるための取り組みは今はじまっていて、それが我々が作った電子お薬手帳です。患者さんとの情報のやり取りを細かく行いながら正しいデータを収集していく取り組みは不可欠で、それを営利目的の企業にしていただく事には反対します。
アジアの国々の健康管理に、日本の医療モデルが役立ちますように。