Anlässlich des EAN, Helsinki, Finnland, wurden am 21. Juni 2025 neue Daten zur Rolle der KI als unterstützendes Diagnosetool vorgestellt. Den Daten zufolge kann das neueste ChatGPT-Modell GPT-4o die Diagnoselücken zwischen Nicht-Spezialisten und Experten im Bereich der Polyneuropathie verringern [1]. Polyneuropathie betrifft etwa 1–3 % der Erwachsenen und etwa 13 % der über 70-Jährigen, doch aufgrund der mehr als 100 möglichen Ursachen kommt es häufig zu Fehldiagnosen [2]. Die Fachzentren sind häufig überlastet, sodass ein KI-Assistent Überweisungen triagieren, Fälle mit Warnsignalen kennzeichnen und gezielte Labor- oder genetische Untersuchungen vorschlagen könnte, um Engpässe in der fachärztlichen Versorgung zu verringern. Ziel dabei ist es, Behandlungen von höchster Dringlichkeit schnellst möglich zu erkennen.
Ein Team unter der Leitung von Dr. Alberto De Lorenzo vom IRCCS Humanitas in Mailand stellte 100 reale Fälle von Polyneuropathie aus tertiären Zentren zusammen. Jeder Fall wurde in GPT-4o mit einer einzigen „Zero-Shot-Chain-of-Thought”-Eingabe eingegeben, die eine Leitdiagnose, zwei Differentialdiagnosen und einen Bestätigungstest anforderte. Anschließend bearbeiteten 26 Neurologen aus Zentren in zehn Ländern dieselben Fälle (14 waren Neuromuskuläre Spezialisten und 12 allgemeine Neurologen). Die Diagnose fand zunächst allein statt, anschließend zur Überprüfung der Antwort mit KI. GPT-4o zeigte eine starke Konsistenz über verschiedene Versuche hinweg und erreichte einen Cohen-Kappa-Wert von 0,80 (p < 0,001). Es identifizierte in 65,5 % der Fälle die Leitdiagnose korrekt und übertraf damit Nicht-Spezialisten (54,4 %), lag aber immer noch hinter Fachspezialisten (73,9 %) zurück. Bei der Berücksichtigung der beiden Differentialdiagnosen vergrößerte sich der Vorsprung des Modells gegenüber Nicht-Spezialisten auf 82 % gegenüber 68,5 %. Die KI war den Spezialisten auch bei der Empfehlung der geeigneten bestätigenden Untersuchung ebenbürtig (68 % gegenüber 67,3 %) und übertraf Nicht-Spezialisten, die in weniger als der Hälfte der Fälle den richtigen Test identifizierten, bei weitem.
In 21 % der Fälle änderten Nicht-Fachärzte für Neurologie ihre ursprüngliche Diagnose, nachdem sie die Vorschläge von GPT-4o geprüft hatten, was auf ein allgemeines Vertrauen in das Tool und möglicherweise auf eine gewisse Unsicherheit oder Zurückhaltung bei ihren ursprünglichen Entscheidungen hindeutet. Das Modell schien ihnen Sicherheit oder eine neue Perspektive zu geben, was einigen Teilnehmern half, ihre ursprünglichen Antworten mit mehr Zuversicht zu überdenken. Fachärzte hingegen änderten ihre Antworten seltener, und viele von ihnen empfanden die Vorschläge von ChatGPT als zu grundlegend oder gelegentlich als nicht zielführend.
Fazit des Studienleiters: „GPT-4o ist nicht perfekt und verfügt nicht über das Fachwissen oder die Urteilsfähigkeit eines Klinikers, aber unsere Daten deuten darauf hin, dass sein überwachter Einsatz dazu beitragen könnte, die Fachwissenslücke zu schließen und Kliniker zu den richtigen Folgeuntersuchungen zu leiten, ohne das klinische Urteilsvermögen zu ersetzen“, sagte Dr. De Lorenzo.
„In ländlichen oder ressourcenarmen Gebieten, in denen der Zugang zu Fachwissen über neuromuskuläre Erkrankungen begrenzt ist, könnte GPT-4o als leicht zugängliches, kostengünstiges Instrument zur Unterstützung der diagnostischen Entscheidungsfindung dienen. Durch die Anleitung zu frühen Diagnoseschritten und die Identifizierung von Patienten, die dringend überwiesen werden müssen, könnte das Tool Verzögerungen reduzieren und die Versorgung optimieren.“
Elke Engels
Referenzen:
1. De Lorenzo A et al. ChatGPT-4o in Diagnosis and Management of Real-Life Polyneuropathy Cases: Comparative Analysis with Neurologists. Vorgestellt auf dem Kongress der Europäischen Akademie für Neurologie (EAN) 2025; 21. Juni 2025; Helsinki, Finnland.
2. Brongé W et al. Epidemiologie und funktionelle Auswirkungen früher Anzeichen einer peripheren Neuropathie bei älteren Erwachsenen aus der Allgemeinbevölkerung. Gerontology 2024; 70(3)
Bildquelle:© Rostislav Sedlacek_stock.adobe.com



