ChatGPT vs. dietitian: a plate of Mediterranean food beside a laptop where an AI builds a meal plan

KI-generiertes Bild

ChatGPT vs. Ernährungsberater: Was die Studie zeigt

Christopher KlenkChristopher Klenk7 Min. Lesezeit

ChatGPT baut dir auf Zuruf einen Ernährungsplan — aber kann es das so gut wie ein ausgebildeter Ernährungsberater? Eine neue Studie im Journal of Nutrition hat genau das getestet: Drei Diätologen und ChatGPT erstellten Ernährungspläne für Menschen mit Übergewicht, erhöhten Blutfetten, Bluthochdruck oder Typ-2-Diabetes — gemessen wurde gegen offizielle Leitlinien. Das Ergebnis ist für beide Lager unbequem. ChatGPT war erstaunlich nah dran und fällt gleichzeitig bei Dingen durch, die ein guter Berater im Schlaf macht. Und eine zentrale Frage lässt das frei lesbare Abstract offen: Mit welchem Modell wurde hier überhaupt getestet?

Auf einen Blick

Auf einen Blick: ChatGPT erreichte bei der Treue zu offiziellen Ernährungsleitlinien 55–83 Prozent, die menschlichen Berater 50–100 Prozent — also fast gleichauf. ChatGPT empfahl allerdings nie die Mittelmeerdiät und gab Männern systematisch mehr Kalorien als Frauen. Vitamin D war in allen Plänen zu niedrig, auch bei den Profis. Das Abstract nennt das getestete Modell nicht — der Zeitpunkt der Studie deutet auf GPT-4o oder GPT-5 hin, die genaue Version steckt im kostenpflichtigen Volltext.

Was die Studie gemacht hat — und was im Abstract fehlt

Drei Ernährungsberater und ChatGPT erstellten Pläne für dieselben drei Patientenfälle — welches Modell dabei lief, steht im frei zugänglichen Abstract allerdings nicht. Die Fälle waren realistisch gestaffelt: Übergewicht plus erhöhte Blutfette, dann zusätzlich Bluthochdruck, dann zusätzlich Typ-2-Diabetes. Die Prompts wurden in mehreren Runden verfeinert, der Nährstoffgehalt jedes Plans mit einer Analyse-Software ausgewertet und mit den offiziellen Empfehlungen abgeglichen. Zusätzlich prüften die Forscher, ob ChatGPT für Männer und Frauen sowie für vier ethnische Gruppen unterschiedliche Pläne ausspuckt.

Das ist ein sauberes Setup. Was fehlt, ist die Modellangabe im Abstract — und der komplette Methodenteil liegt hinter einer Paywall. Klingt nach einem Detail, ist aber keins. Warum, dazu unten mehr.

Das Ergebnis: erstaunlich nah dran

Bei der Treue zu offiziellen Leitlinien lag ChatGPT mit 55–83 Prozent fast gleichauf mit den Beratern, die 50–100 Prozent erreichten. Das ist näher, als die meisten erwartet hätten — und näher, als es einem Berufsstand lieb sein dürfte. Die Unterschiede lagen weniger in „richtig oder falsch" als in der Handschrift: Die Diätologen setzten auf mehr Kohlenhydrate, Zucker, gesättigte Fette und Natrium, ChatGPT auf mehr mehrfach ungesättigte Fette. Im Bluthochdruck-Fall planten die Menschen außerdem mehr Energie und Ballaststoffe ein als die KI.

Ernährungsberater

ChatGPT

Leitlinien-Treue

50–100 %

55–83 %

Mittelmeerdiät empfohlen

ja

nie

Tendenz bei Makros

mehr KH, Zucker, gesättigte Fette, Natrium

mehr mehrfach ungesättigte Fette

Energie & Ballaststoffe (Bluthochdruck-Fall)

höher

niedriger

Vitamin D

zu niedrig

zu niedrig

Wer hier einen klaren Sieger sucht, wird enttäuscht. Auf der reinen Nährstoff-Ebene spielen beide in einer ähnlichen Liga — und genau das ist die eigentliche Nachricht.

Wo ChatGPT patzt

ChatGPT empfahl in keinem einzigen Fall die Mittelmeerdiät — also genau den Ernährungsansatz, den die europäischen Leitlinien als Erstmaßnahme bei Herz-Kreislauf-Risiko führen. Die Berater taten das. Das ist kein kosmetischer Unterschied: Bei Übergewicht, hohen Blutfetten und Bluthochdruck ist ein mediterranes Muster eine der am besten belegten Stellschrauben überhaupt. Eine KI, die es nicht von allein vorschlägt, übersieht den naheliegendsten Hebel.

Dazu kommt ein Bias, der nachdenklich macht. ChatGPT gab Männern systematisch energiereichere Pläne als Frauen — statistisch signifikant, aber eben nicht für alle gleich: Der Unterschied war nur bei den als „Caucasian" und „Mexican" bezeichneten Fällen ausgeprägt. Heißt im Klartext: Die KI behandelte Menschen je nach zugeschriebener Herkunft unterschiedlich, ohne dass es dafür einen ernährungsphysiologischen Grund gab. Das ist die Art von verstecktem Muster, die man einem Tool nicht ansieht, wenn man nur den eigenen Plan vor sich hat.

Fairerweise: Vitamin D war in allen Plänen zu niedrig — auch in denen der Profis. Diese Lücke ist also kein KI-Problem, sondern ein bekannter blinder Fleck der Ernährungsplanung an sich. Ich coache keine Herzpatienten, aber das Grundmuster kenne ich aus der Ernährungsseite des Trainings: Ein Plan kann auf dem Papier sauber aussehen und trotzdem bei einem entscheidenden Mikronährstoff danebenliegen. Mein Eindruck aus der Praxis ist, dass KI-Pläne genau hier auffällig oft schwächeln — systematisch gegengeprüft habe ich das aber noch nicht, und genau das nehme ich mir als Nächstes vor.

Welches Modell lief hier eigentlich?

Das Abstract nennt das getestete Modell nicht, aber der Studienzeitpunkt grenzt es auf GPT-4o oder GPT-5 ein. Laut PubMed-History wurde die Arbeit am 19. Januar 2026 eingereicht — die ChatGPT-Abfragen liefen also im Lauf des Jahres 2025. Und da hat sich der Standard verschoben: Bis Anfang August 2025 war GPT-4o das Default-Modell in ChatGPT, dann löste GPT-5 es ab. Realistisch lief hier also eines von beiden.

Meine Einschätzung — und die ist aus dem Datum geschlossen, nicht aus dem Paper: Bei einer Einreichung im Januar lagen die Tests eher in der zweiten Jahreshälfte 2025, was eher für GPT-5 spricht. Ausschließen lässt sich GPT-4o aber nicht, denn es blieb für zahlende Nutzer wählbar. Sicher wissen wir es erst aus dem Methodenteil — und der kostet.

Warum dieser fehlende Halbsatz so viel wiegt: „ChatGPT" ist kein Modell, sondern eine Produktfamilie. Zwischen GPT-3.5, GPT-4o und GPT-5 liegen Welten an Qualität. Ein Befund, der die Version offenlässt, ist schwer auf das zu übertragen, was heute in deinem Chatfenster steckt — und ohne genannte Version lässt sich die Studie nicht sauber wiederholen. Das ist dasselbe Muster, das ich schon bei der KI-Marathon-Studie und der Frage, wie gut der Test selbst eigentlich war, kritisiert habe.

Forschung, die du mitbezahlst, aber nicht lesen darfst Ein großer Teil solcher Studien entsteht mit öffentlichen Geldern — und landet trotzdem hinter der Bezahlschranke eines Verlags. Ohne Uni-Zugang zahlst du als normaler Leser pro Artikel drauf, nur um die Methode nachzulesen. Bei einer Studie, die ausgerechnet die Verlässlichkeit von KI-Ratschlägen bewertet, ist das doppelt ärgerlich: Genau die Angabe, die du zum Einordnen brauchst — welches Modell — bleibt den Menschen verborgen, die das Tool täglich nutzen.

Was das für deinen KI-Ernährungsplan heißt

Nutze ChatGPT für den ersten Entwurf, aber überlass ihm nicht das letzte Wort — und füttere es mit dem Kontext, den es nicht von allein hat. Die Studie zeigt, dass die KI auf der Nährstoff-Ebene überraschend solide arbeitet. Sie zeigt aber genauso, dass sie naheliegende Standards übergeht und stille Verzerrungen einbaut, die du erst siehst, wenn du gezielt danach suchst.

So holst du mehr aus dem KI-Plan heraus Gib dem Modell vor, woran es sich orientieren soll, statt blind zu vertrauen: Nenne deinen Gesundheitskontext und bitte aktiv um ein leitlinienbasiertes Muster (etwa mediterran), wenn es passt. Lass dir den Vitamin-D- und Mikronährstoff-Gehalt getrennt ausweisen. Und prüfe, ob sich der Plan ändert, wenn du Geschlecht oder Herkunft weglässt — taucht dann plötzlich eine andere Kalorienzahl auf, weißt du, dass ein Bias mitläuft.

Wenn du tiefer einsteigen willst, wie du so einen Plan von Grund auf richtig aufsetzt, haben wir das in KI Ernährungsplan selbst erstellen mit ChatGPT, Claude und Gemini Schritt für Schritt durchgespielt. Und wenn dich die größere Frage umtreibt, ob KI den Profi ersetzt, lohnt der Blick in KI vs. Trainer: Was Studien wirklich zeigen.

Die ehrliche Einordnung lautet: ChatGPT ist 2026 ein brauchbarer Sparringspartner für deine Ernährung, kein Ersatz für einen Menschen, der dich kennt. Behandle den KI-Plan wie den Vorschlag eines fleißigen, aber kontextblinden Praktikanten — du musst ihn gegenlesen, bevor du ihn lebst. Konkret heißt das: Nimm deinen nächsten KI-Ernährungsplan, gleiche ihn aktiv gegen ein mediterranes Muster ab und lass dir Vitamin D separat ausrechnen. Diese zwei Minuten schließen die größte Lücke, die diese Studie offengelegt hat.

Quellen

  • Katsigiannis G, Panoutsopoulos G, Perrea A, Detopoulou P. Comparison of ChatGPT and dietitians in formulating diet plans and recommendations for patients with cardiometabolic diseases. The Journal of Nutrition, 2026. DOI: 10.1016/j.tjnut.2026.101667 (PMID: 42285417). PubMed-History: eingereicht 19.01.2026, überarbeitet 05.05.2026, angenommen 08.06.2026, online 12.06.2026. Modellversion im frei zugänglichen Abstract nicht angegeben; Volltext kostenpflichtig.

  • 2021 ESC Guidelines on Cardiovascular Disease Prevention in Clinical Practice — die Mittelmeerdiät wird als Klasse-I-Empfehlung geführt. European Society of Cardiology, 2021.

  • ChatGPT-Standardmodelle: Hello GPT-4o (Standard ab Mai 2024) und Introducing GPT-5 (neuer Standard ab 7. August 2025; GPT-4o blieb für zahlende Nutzer weiter wählbar). OpenAI, 2024/2025.