Studie im Check: Machine Learning statt KI für deinen Trainingsplan

Wer läuft, läuft. Wer ins Gym geht, macht Bankdrücken. Das eigentliche Defizit trainiert kaum jemand – weil kaum jemand weiß wo es liegt. Ein Machine-Learning-Modell das genau das erkennt und daraus automatisch einen Trainingsplan baut, haben chinesische Forscher jetzt in Scientific Reports veröffentlicht. Mit echten Daten, einem randomisierten Trial – und ein paar Lücken die du kennen solltest. Und ganz ohne KI-Chatbot.

Auf einen Blick

Chinesische Forscher haben ein auf Trainingsdaten trainiertes Modell aus vier Fitness-Tests gebaut, das erkennt wo dein größtes Defizit liegt – und deinen Trainingsplan genau darauf ausrichtet. Im Test mit 1.160 Teilnehmern, bei dem eine Gruppe den vom Modell erstellten Plan bekam und eine Gruppe normal weitertrainierte: deutlich mehr Klimmzüge, bessere Laufzeiten, 23,5 % weniger Übergewicht. Das klingt beeindruckend, bis du siehst dass parallel auch die Ernährung komplett umgestellt wurde – und das in den Ergebnissen nicht rausgerechnet ist. Trotzdem zeigt die Studie ein Prinzip, das funktioniert.

Die Idee dahinter ist einfacher als sie klingt

Du machst vier Tests: 3.000-Meter-Lauf, Klimmzüge, Sit-ups in 60 Sekunden, einen kurzen Sprint-Shuttle. Diese Daten werden in ein Machine-Learning-Modell eingespeist – ein System das auf tausenden echten Fitness-Messprofilen trainiert wurde und dabei gelernt hat, Muster zu erkennen. Es schaut sich an, wo du im Vergleich zu ähnlichen Profilen am schlechtesten abschneidest. Daraus bestimmt es dein größtes Defizit – und genau das bekommt im Trainingsplan den meisten Fokus.

Die Grundlage heißt SHAP – eine Methode die dem Modell sozusagen eine Erklärungspflicht auferlegt: Es reicht nicht zu sagen „du bist übergewichtig“, es muss begründen warum. Im Klartext: Das Modell sagt „deine Klimmzugzahl hat mit Abstand am stärksten dazu beigetragen.“ Dieser Wert steuert dann direkt, wie dein Trainingsplan zusammengebaut wird. Mehr Kraftdefizit, mehr Krafttraining. Schlechte Ausdauer, mehr HIIT und Ausdauereinheiten.

Wer es genau wissen will: Was das Modell konkret macht

Technisch steckt dahinter ein 1D-CNN mit Multi-Head-Attention als Feature-Extraktor, danach ein LightGBM-Classifier. Das CNN verarbeitet die 15 Zwischenzeiten des 3.000-Meter-Laufs als echte Zeitreihe – die anderen drei Tests werden schlicht dupliziert, um ins Format zu passen. Die 94,5 % Klassifikationsgenauigkeit für BMI-Kategorien klingen eindrucksvoll; das Paper zeigt aber, dass der Prescription-Layer darüber (SHAP → Trainingsbausteine) regelbasiert ist, kein weiteres Machine Learning.

Das ist kein Chatbot – und das ist wichtig

Bevor jemand fragt: Das hier hat mit einem Chatbot technisch nichts zu tun. Kein ChatGPT, kein Claude, kein Prompt. Was die Forscher trainiert haben ist ein spezialisiertes Modell auf echten Messdaten – und der Unterschied ist für die Praxis entscheidend.

Stell dir vor, du fragst ChatGPT: „Ich mache 8 Klimmzüge, laufe 3.000 Meter in 14 Minuten und schaffe 32 Sit-ups in 60 Sekunden – wo ist mein größtes Defizit?“ ChatGPT gibt dir eine Antwort. Eine plausible sogar. Aber die basiert auf Texten die das Modell irgendwann gelesen hat – Artikel, Foren, Bücher über Training. Es weiß nicht, wie deine 14 Minuten im Vergleich zu tausenden anderen Menschen mit ähnlichem Körpergewicht aussehen. Es ordnet nicht ein, es interpretiert.

Das Modell aus dieser Studie macht genau das. Es wurde auf 6.698 echten Messprofilen trainiert und hat dabei gelernt: Welche Kombination aus Laufzeit, Klimmzügen, Sit-ups und Shuttle-Zeit ist statistisch mit welcher Gewichtskategorie verknüpft? Wenn du deine vier Testwerte reinsteckst, gibt es keine generierte Antwort zurück – sondern eine Vorhersage die aus gemessenen Daten folgt. Und via SHAP siehst du schwarz auf weiß: deine Klimmzugzahl hat am stärksten zur Klassifikation beigetragen, mit einem Wert von +0,21. Der Shuttle-Run hat mit −0,08 dagegen gearbeitet. Das ist nicht interpretiert, das ist gerechnet.

Ein KI-Chatbot kann dir erklären, wie ein Plan für jemanden mit Kraftdefizit aussehen sollte. Dieses Modell erkennt selbst, dass du ein Kraftdefizit hast.

Was der Test zeigt – und was er nicht beweist

1.160 Teilnehmer, 12 Wochen, zwei Gruppen: Eine bekam den vom Modell erstellten Trainingsplan, die andere trainierte nach Standard-Protokoll. Die Zahlen der ersten Gruppe sind klar besser – im Schnitt 3,1 zusätzliche Klimmzüge, 54 Sekunden (0,9 Minuten) schneller über 3.000 Meter, 3,3 Sekunden schneller im Shuttle. Da ist was passiert.

Das Problem steht im Paper selbst: Neben dem Trainingsplan enthielt die Intervention auch ein detailliertes Ernährungsprogramm mit konkreten Kalorienvorgaben und Makro-Zielen. Und dieses Ernährungsprogramm wurde in den Ergebnissen nicht herausgerechnet. Du kannst also nicht sauber sagen, wie viel der Trainingsplan beigetragen hat und wie viel die Ernährungsumstellung.

Zwei weitere Punkte die du wissen solltest

Die Stichprobe besteht ausschließlich aus 18- bis 20-jährigen männlichen Studierenden einer chinesischen Berufsschule. Keine Frauen, keine älteren Erwachsenen, keine Leistungssportler – homogener geht kaum. Dazu klassifiziert das Modell BMI-Kategorien, nicht Körperfett oder Muskelmasse. Wer Muskeln hat landet im „Übergewicht“-Cluster, egal wie fit er tatsächlich ist. Das Modell erkennt das nicht.

Das Prinzip funktioniert – was du heute daraus machen kannst

Das Modell aus der Studie wirst du nicht einfach herunterladen können – die Daten sind nicht öffentlich, der Code auch nicht. Aber das Grundprinzip ist heute schon umsetzbar, mit dem was du hast. Wer sein schwächstes Ergebnis kennt und den Trainingsplan konsequent darauf ausrichtet, kommt nachweislich schneller voran als mit einem generischen Plan. Die Studie liefert dafür Zahlen, kein Bauchgefühl.

Drei Wege wie du das heute nutzen kannst

Einfach: Mach die vier Tests selbst und gib die Werte in einen Chatbot-Prompt ein – zum Beispiel so: „Ich mache 8 Klimmzüge, laufe 3.000 Meter in 14:30 Minuten, schaffe 28 Sit-ups in 60 Sekunden und 32 Sekunden im 30×2-Shuttle. Welches ist mein größtes Defizit im Vergleich zu einem fitten Sportler meines Alters – und wie soll ich die nächsten 4 Wochen trainieren?“ Kein spezialisiertes Modell, aber das Grundprinzip funktioniert trotzdem.
Besser: Du nutzt deine Wearable-Daten (HRV, Trainingsbelastung, VO₂max-Schätzung) als Input statt vier Einzeltests. Mehr Datenpunkte, bessere Priorisierung.
Für Technik-Enthusiasten: Du trainierst ein eigenes kleines Modell auf deinen eigenen Trainingsdaten der letzten Jahre. Mit Python machbar – und dann tatsächlich auf dich personalisiert, nicht auf Daten aus einer chinesischen Berufsschule.

Was passiert, wenn man das Beste aus beiden Welten kombiniert – spezialisiertes Modell für die Diagnose, Chatbot für den Plan – ist die eigentlich spannende Frage. Die Bausteine existieren heute alle. Was fehlt ist jemand der sie zusammensetzt.

Das Prompt-Paradoxon greift hier direkt: Wer weiß was Ausdauer, Maximalkraft und anaerobe Kapazität unterscheidet, bekommt vom Chatbot eine brauchbare Priorisierung und kann den perfekten Trainingsplan mit ChatGPT, Gemini oder Claude selbst erstellen. Wer das nicht weiß, bekommt eine selbstbewusst formulierte Antwort die er nicht einordnen kann.

Quelle: Mo M. et al. A machine learning framework for personalized exercise prescription based on BMI and physical fitness assessment. Scientific Reports (2026). DOI: 10.1038/s41598-026-42405-2

Titel: Studie im Check: Ganz ohne KI-Chatbot – Mit Tests & Machine Learning zum passenden Trainingsplan

Die Idee dahinter ist einfacher als sie klingt

Wer es genau wissen will: Was das Modell konkret macht

Das ist kein Chatbot – und das ist wichtig

Was der Test zeigt – und was er nicht beweist

Zwei weitere Punkte die du wissen solltest

Das Prinzip funktioniert – was du heute daraus machen kannst

Drei Wege wie du das heute nutzen kannst

Das könnte dich interessieren

HRV-Apps: was eine Studie über 206 Apps zeigt

ACSM Krafttraining-Leitlinie 2026: Neu nach 17 Jahren

Schweiß-Biomarker im Funktionstextil: Laborwerte ohne Blut?