Patienten nutzen immer häufiger digitale Tools, um Krankheiten zu erkennen und Gesundheitsempfehlungen zu erhalten. Ein Team von Arbeitswissenschaftlern der TU Berlin hat nun die Qualität und Wirksamkeit solcher Tools genauer untersucht. Die Wissenschaftler entwickelten dazu eine neue standardisierte Methode, um die Genauigkeit der Empfehlungen durch generative KI-Modelle wie ChatGPT sowie speziell entwickelte Symptom-Checker-Apps zu bewerten. Die Methode setzt dabei auf echte Patientenfälle. Dadurch lässt sich realistischer einschätzen, wie präzise und hilfreich die Tools in der Praxis sind. Die Ergebnisse zeigen, dass Symptom-Checker-Apps deutlich hilfreicher sind als ChatGPT, insbesondere wenn es um die Unterscheidung zwischen harmlosen und ernsten Symptomen geht. Während ChatGPT fast jeden Fall als Notfall oder hochdringlich einstuft und dadurch unnötige Arztbesuche erhöht, können spezialisierte Apps in den meisten Fällen fundierte und angemessenere Empfehlungen geben. Gut funktionierende Symptom-Checker-Apps tragen dazu bei, dass Nutzer sich eher für die Selbstversorgung entschieden und so die Entlastung des Gesundheitssystems mit unterstützen.
Literatur: Li W et al. Nature Aging 2025. doi: 10.1038/s43587–025–00819-z
Quelle: Helmholtz Zentrum für Infektionsforschung HZI
Bildquelle© lucegrafiar – stock.adobe.com



