„Da werden Märchen erzählt“
Interview
Bringt die elektronische Patientenakte (ePA) einen Schub für die medizinische Forschung? Der ehemalige IQWiG-Chef Jürgen Windeler über problematische Daten, methodische Limitationen und die Gefahr einer zweckentfremdeten Auswertung.
Die Daten aus der elektronischen Patientenakte (ePA) sollen der Forschung zugänglich gemacht werden. Damit sind große Erwartungen verbunden: Bundesgesundheitsminister Karl Lauterbach spricht von einem „Datenschatz“, den es bisher nirgendwo sonst gibt – und von einem echten „Gamechanger für die Forschung“ (1). Was halten Sie davon?
windeler: Es gibt nur wenig Anhaltspunkte dafür, dass dieAuswertung solcher Daten zu bahnbrechenden wissenschaftlichen Erkenntnissen führen könnte. Ich wüsste nicht, wie das gehen soll.
Warum nicht? Was ist das Problem mit solchen Daten?
windeler: Zunächst mal: Solche Datensätze unterliegen verschiedensten Verzerrungen (Bias), unter anderem sind sie gerichtet unvollständig. Beispielsweise können Patientinnen und Patienten dafür sorgen, dass nicht alle Daten in ihrer ePA auftauchen. Das geschieht nicht zufällig, sondern systematisch nach ihren Wünschen oder Befürchtungen. Der ePA-Datensatz deckt zudem nur GKV-Patienten ab, Informationen zu Privatversicherten fehlen. Die Gruppe der Privatversicherten ist aber keine Zufallsstichprobe, sondern eine sehr gerichtete Auswahl. Auch Abrechnungsdaten unterliegen einem Bias: In jeder Gebührenordnung gibt es positive und negative Anreize, die für eine verzerrte Abbildung sorgen. Wenn in einem Datensatz zufällig jede zehnte Zahl fehlt, ist das nicht so schlimm – das kann man mit statistischen Methoden korrigieren. Wenn ein Datensatz aber nicht zufällig, sondern in mehrfacher Hinsicht systematisch verzerrt ist, macht das eine wissenschaftliche Auswertung sehr schwierig.
Welche Forschungsfragen könnte man mit solchen Daten beantworten?
windeler: Theoretisch könnte man mit solchen Daten beispielsweise Häufigkeits-Fragen beantworten: Wie häufig kommt Multiple Sklerose in Deutschland vor? Praktisch werden die Datensätze aber Fälle enthalten, die als Multiple-Sklerose-Fälle kodiert wurden, in Wirklichkeit aber keine sind – und sie werden Multiple-Sklerose-Fälle enthalten, die nicht als solche kodiert wurden. Möglicherweise hilft die Auswertung von Medikamenten-Daten: Wer nimmt MS-typische Medikamente? Auch das funktioniert aber nur ansatzweise. Sie haben also Datensätze aus verschiedenen Quellen, deren Verzerrungen Sie nicht ohne Weiteres mit statistischen Methoden korrigieren können. Da kommt man dann zu Ergebnissen, denen ein langes Kapitel über die methodischen Limitationen der Auswertung beigefügt werden muss. Und am Ende bleibt nur Achselzucken.
Können Datensätze aus verschiedenen Quellen überhaupt einer bestimmten Person zugeordnet werden?
windeler: Ja. Solche Daten werden nicht anonymisiert, sondern pseudonymisiert. Das heißt: Die Person heißt im Datensatz nicht mehr „Hans Müller“, sondern beispielsweise X35X_R65-54. Anhand dieser Kennzeichnung findet die Zuordnung statt: Datensätze aus der ePA, dem Krebsregister oder anderen Quellen können korrekt zusammengeführt werden.
Zum Nutzen von medizinischen Interventionen kann man anhand solcher Daten keine Aussage machen?
windeler: Bei den meisten Fragestellungen, die für die Patientenversorgung wichtig sind, helfen solche Daten nicht weiter. Wenn man Aussagen über den Nutzen einer Intervention machen will, braucht man immer einen Vergleich. Ein Beispiel: Ich habe Kopfschmerzen und nehme eine Tablette. Nach einer Stunde sind meine Kopfschmerzen weg. Ein häufiger logischer Fehler ist es dann, aus dem zeitlichen Zusammenhang zu schließen, dass ein kausaler Zusammenhang vorliegt. Ich weiß aber nicht: War es die Tablette? Vielleicht wären die Kopfschmerzen auch ohne Tablette weggegangen. Nur ein fairer Vergleich kann Aufschluss über den Nutzen der Tablette geben. Große Beweiskraft haben in dieser Hinsicht randomisierte kontrollierte Studien: Dabei wird eine Gruppe, bei der eine Intervention durchgeführt wird, mit einer Kontrollgruppe verglichen. Die Zuordnung der Probanden zu den Gruppen erfolgt zufällig. Mit weiteren methodischen „Sicherungs“-Maßnahmen kann man dann die beobachteten Unterschiede zwischen den Gruppen ziemlich verlässlich auf die Intervention zurückführen. Wie man auf Grundlage von ePA-Daten „Forschung“ mit auch nur annähernd ähnlicher Aussagesicherheit durchführen könnte, hat mir noch niemand erklärt. Das funktioniert ja schon kaum mit Registerdaten, die immerhin um Klassen besser sind als die ePA-Daten.
Was ist der Unterschied zwischen Registerdaten und ePA-Daten?
windeler: In gut geführten Registern ist eine Struktur und eine Qualitätssicherung vorgegeben. Die Informationen werden gezielt erhoben. Sogenannte Confounder, also Störgrößen, sind idealerweise abgebildet und können berücksichtigt werden. Das ist etwas völlig anderes als ein Datensatz, der enthält, was unkontrolliert in eine ePA eingestellt wird.
Kennen Sie denn Beispiele für Studien, die mit Hilfe von unstrukturierten Daten wie jenen aus der ePA zu substanziellen, für die Patientenversorgung nützlichen Ergebnissen gekommen sind?
windeler: Nein. Es wäre hilfreich, wenn jemand, der für die Auswertung von Gesundheitsdaten im großen Stil plädiert, solche Beispiele vortrüge. Das würde mich interessieren und vielleicht sogar überzeugen – mag ja sein. Meine Hypothese ist: Es gibt solche Beispiele nicht. Große Erkenntnisse mit Hilfe von ePA-Daten? Dramatische Verbesserung in der Versorgung? Da werden Märchen erzählt.
Wer könnte denn überhaupt etwas mit diesen Daten anfangen? Wer hat ein Interesse daran, sie zu nutzen?
windeler: Naja, daran haben ganz offensichtlich viele Player ein Interesse. Es gibt Wissenschaftlerinnen und Wissenschaftler, die mit solchen Daten trotz der damit verbundenen Probleme arbeiten wollen. Krankenkassen könnten auf die Idee kommen, in Daten ihrer Versicherten zu stöbern und zu sagen: „Hören Sie mal, wir haben festgestellt, dass Sie ein erhöhtes Risiko für diese oder jene Erkrankung haben.“ Der Paragraf 25b SGB V eröffnet Raum für solche Szenarien. Ich bin sehr gespannt, was da auf uns zukommt. Auch Pharmafirmen wollen Daten auswerten, um zu erfahren, wie ihre Medikamente eingesetzt werden.
Offenbar soll der Pharma-Standort Deutschland durch einen leichteren Zugang zu Gesundheitsdaten gestärkt werden. Wäre das nicht auch wichtig für die Patientenversorgung?
windeler: Die häufige Rede davon, dass so neue Medikamente schneller ins System kommen sollten, verkennt, dass eigentlich jeder ein großes Interesse haben müsste, dass sie sorgfältig geprüft sind, wirklich Vorteile für Patientinnen und Patienten bringen und man ihr Risikoprofil gut kennt. Und die ePA-Daten sind für die Klärung solcher Nutzen-Risiko-Fragestellungen nun mal nicht geeignet.
Welches Interesse haben die Pharmafirmen denn dann an diesen Daten? Was wollen sie herausfinden?
windeler: Da geht es eher um Marktforschung. Man will sich beispielsweise ansehen: Nehmen die Multiple-Sklerose-Patienten das von einer bestimmten Firma hergestellte Medikament? Gibt es da noch Luft nach oben? Wie groß ist das Marktpotenzial? Wenn Pharmafirmen mit Hilfe solcher Auswertungen einen besseren Einblick in das Marktgeschehen bekommen, können sie ihre Strategien optimieren.
Karl Lauterbach sagt, dass sich auch Firmen wie Meta, OpenAI und Google für diesen Datensatz interessieren (2) …
windeler: Na, selbstverständlich! Diese Firmen sind immer an unseren Daten interessiert. Es ist zum Beispiel durchaus vorstellbar, dass große Tech-Firmen ein Interesse daran haben, mit solchen Daten ihre Künstliche-Intelligenz-Systeme zu trainieren. Sie könnten beispielsweise versuchen, bestimmte mit Diagnosen korrelierende Muster zu entdecken, um medizinische Entscheidungen zu unterstützen. Solche Entscheidungshilfe-Modelle gibt es bereits – manche sind so gut oder besser als Menschen, manche schlechter, die meisten schlecht geprüft. Doch auch bei den Tech-Firmen wird natürlich die Vermarktung eine Rolle spielen: Es ist hilfreich, möglichst viel über die Menschen zu wissen, um ihnen gezielte Angebote machen zu können. Der Gesundheitsbereich wird immer lukrativer. Insofern wird es für kommerzielle Firmen lohnend sein, sich eine wissenschaftliche Fragestellung auszudenken, um über das Forschungsdatenzentrum auf die Daten zugreifen zu können.
Was ist das Forschungsdatenzentrum?
windeler: Aufgabe des Forschungsdatenzentrums ist es, Abrechnungsdaten der Kassen, Daten aus der ePA und weitere Daten der GKV-Versicherten für die Forschung zugänglich zu machen. Das soll auf Antrag geschehen, der vom Zentrum geprüft wird. Wie und nach welchen Kriterien dies geschieht, weiß man nicht. In § 303e SGB V ist aufgeführt, zu welchen Zwecken die Daten verarbeitet werden dürfen – unter anderem zur „wissenschaftlichen Forschung zu Fragestellungen aus den Bereichen Gesundheit und Pflege, Analysen des Versorgungsgeschehens, sowie Grundlagenforschung im Bereich der Lebenswissenschaften“. Das ist derart schwammig, dass eine kommerzielle Firma schon ziemlich fantasielos und ungeschickt sein müsste, um eine Absage zu bekommen. Man sollte vielleicht nicht „Marktforschung“ in den Antrag schreiben, sondern lieber „wissenschaftliches Forschungsvorhaben“ – ansonsten sind im Gesetz jedenfalls keine ernsthaften Zugangsbeschränkungen zu erkennen.
Patientinnen und Patienten, die keinen Widerspruch gegen die Nutzung ihrer ePA-Daten für „Forschungszwecke“ einlegen, stellen sich das womöglich anders vor …
windeler: Ja. Meiner Ansicht nach wird zu wenig darüber diskutiert, für welche Fragestellungen solche Daten überhaupt genutzt werden können und von wem. Und ich vermisse eine halbwegs vernünftige Darstellung der Risiken. Es gibt eine stürmische Entwicklung im Bereich der Künstlichen Intelligenz. Glaubt man, was zu lesen ist, wäre es doch erstaunlich, wenn Künstliche Intelligenz nicht bald dazu in der Lage sein sollte, die Pseudonymisierung von Daten zu knacken. Die Zuversicht, dass für Forschungszwecke pseudonymisierte Daten auf Dauer sicher sein könnten, erscheint mir ziemlich naiv.
Interview: Martin Niggeschmidt
1) Gesundheitsminister über künstliche Intelligenz: Wird der Arzt irgendwann überflüssig, Herr Lauterbach? Spiegel, 9.9.2023 https://www.spiegel.de/politik/deutschland/karl-lauterbach-ueber-kuenstliche-intelligenz-wird-der-arzt-irgendwann-ueberfluessig-herr-minister-a-3ba0d0c1-706d-4706-ba21-899c7054c878
2) Lauterbach zu Gesundheitsdaten: Google, Meta und OpenAI melden Intersse an. Heise.de, 28.11.2024 https://www.heise.de/news/Lauterbach-zu-Gesundheitsdaten-Google-Meta-und-OpenAI-melden-Interesse-an-10179936.html