
KI-Chatbots MIRA und AMIE übertreffen oder erreichen Ärzte bei der Patientenversorgung, Nature-Studie
Zwei KI-Systeme, MIRA aus Deutschland und AMIE von Google, haben in heute veröffentlichter Forschung eigenständig Diagnosen gestellt und Behandlungen geplant, teilweise genauer als menschliche Ärzte.
Zwei KI-Systeme in Nature veröffentlicht
Zwei unabhängige KI-Modelle für die umfassende Patientenversorgung wurden im Fachjournal Nature vorgestellt. MIRA (Medical Intelligence for Reasoning and Action) wurde von Forschern des Universitätsklinikums Heidelberg und des Else Kröner Fresenius Zentrums für Digitale Gesundheit an der TU Dresden entwickelt. AMIE (Articulate Medical Intelligence Explorer) stammt von Google. Beide Systeme gehen über enge KI-Aufgaben hinaus: Sie führen per Chat Anamnesegespräche, ordnen diagnostische Tests an und formulieren Behandlungspläne mit konkreten Medikamenten.
So funktionieren sie
Die Modelle greifen auf klinische Leitlinien, medizinische Fachliteratur und Daten zu Arzneimittelwechselwirkungen zurück. Googles AMIE liefert Berichten zufolge hochdetaillierte, handlungsorientierte Anweisungen statt vager Vorschläge. Die Systeme sind als „Copiloten“ für Ärzte konzipiert, die Routineaufgaben übernehmen, damit Ärzte mehr Zeit für die direkte Patientenversorgung haben. Der Nature-Artikel stellt fest, dass solche Agenten, wenn sie zu effektivem klinischem Denken fähig sind, Kliniker unterstützen und möglicherweise den Ärztemangel in unterversorgten Regionen lindern könnten.
Wenn KI-Agenten solche Aufgaben übernehmen und effektive klinische Entscheidungen treffen könnten, könnten sie Ärzte bei Routineaufgaben unterstützen und möglicherweise den Ärztemangel in einigen Regionen der Welt lindern.
Testleistung
In simulierten Tests mit KI-generierten Patientendaten auf Basis realer Informationen übertrafen MIRA und AMIE teilweise menschliche Ärzte in Genauigkeit und Präzision. Das Google-Team hob Probleme wie Personalmangel und fragmentierte Versorgung über Arzttermine hinweg hervor und argumentierte, dass KI Lücken schließen könne. Die deutsche Gruppe betonte das Copilot-Konzept, das Ärzte für komplexere menschliche Interaktionen freistellt.
Potenzial und Fallstricke
Trotz vielversprechender Ergebnisse warnen beide Teams, dass die Systeme noch nicht für den realen Einsatz bereit sind. Die Simulationen haben inhärente Grenzen: Ein virtueller Patient reagiert anders als ein Mensch mit akuten Symptomen. MIRAs Behandlungsvorschläge waren im Allgemeinen evidenzbasiert, aber nicht zu 100 % zuverlässig. Kerstin Denecke, Expertin für patientenzentrierte digitale Gesundheit an der Berner Fachhochschule, wies auf Hürden hin, darunter Datenqualität in realen Gesundheitsumgebungen, regulatorische Zulassung, unklare Haftung und die Notwendigkeit repräsentativer Risikostudien.
Für klinische Entscheidungen ist mehr als die Befolgung von Leitlinien nötig. Das Verständnis der individuellen Situation der Betroffenen ist erforderlich.
Expertenperspektiven
Uwe Platzbecker, Medizinischer Vorstand des Universitätsklinikums Dresden, erkannte das in den Ergebnissen gezeigte Potenzial an, betonte aber die Bedeutung einer sicheren, transparenten Integration solcher Innovationen zum Wohle der Patienten. Denecke fügte hinzu, dass klinische Entscheidungen das Verständnis des individuellen Patientenkontexts erfordern, nicht nur die Einhaltung von Leitlinien. Beide Stimmen spiegeln einen vorsichtigen Optimismus wider: Während KI-Agenten eines Tages bei der routinemäßigen klinischen Versorgung helfen könnten, bleiben strenge Validierung und ethische Sicherheitsvorkehrungen unerlässlich.

