Einführung in die neueste Robotik‑Innovation

Physical Intelligence, ein junges Start‑up aus San Francisco, hat kürzlich einen bedeutenden Meilenstein in der KI‑gesteuerten Robotik vorgestellt. Das neue Modell, genannt π0.7, soll Robotern ermöglichen, Tätigkeiten auszuführen, für die sie nie explizit trainiert wurden. Dieser Ansatz könnte die Art und Weise revolutionieren, wie Maschinen in unbekannten Umgebungen eingesetzt werden.

Kompositionale Generalisierung als Schlüsselkonzept

Der zentrale Begriff, den die Forschungsteam in den Vordergrund stellt, ist die kompositionale Generalisierung. Dabei kombinieren die Algorithmen erlernte Fähigkeiten aus unterschiedlichen Kontexten, um noch nie gesehene Probleme zu lösen. Bisher beruhte das Training von Robotern meist auf spezifischer Datenakquise – für jede neue Aufgabe ein separates Modell. π0.7 bricht aus diesem Muster aus und mischt vorhandene Informationen zu neuartigen Lösungsansätzen.

Ein überraschendes Experiment mit einer Heißluftfritteuse

Ein besonders eindrucksvolles Beispiel demonstriert das Modell, wie es mit einer Heißluftfritteuse umgeht – einem Gerät, das im Trainingsdatensatz praktisch kaum vorkam. Nur zwei kurze Szenen enthielten relevante Hinweise: einmal das Schließen der Fritteuse und einmal das Platzieren einer Flasche darin. Durch die Verbindung dieser Fragmente mit umfangreichen Web‑Daten entwickelte π0.7 ein funktionierendes Verständnis des Geräts und konnte schließlich, nach verbaler Anleitung, eine Süßkartoffel fertig garen.

Der Einfluss von Prompt‑Engineering

Die Forscher betonen jedoch, dass die Erfolgsrate stark von der Qualität der Anweisungen abhängt. In einer ersten Versuchsanordnung lag die Erfolgsquote bei lediglich 5 %. Nachdem das Team die Formulierung der Eingabe verfeinert hatte, stieg die Rate auf 95 %. Dies unterstreicht, dass menschliche Expertise beim „Coaching“ von KI‑Modellen nach wie vor entscheidend ist.

Grenzen und Ausblick

Obwohl π0.7 bemerkenswerte Fortschritte zeigt, ist es derzeit noch nicht in der Lage, komplexe mehrstufige Abläufe allein aus einer hohen Zielvorgabe zu bewältigen. Derzeit muss ein Nutzer die Schritte detailliert erläutern. Dennoch eröffnet die Möglichkeit, Roboter in Echtzeit durch Sprache zu trainieren, Perspektiven für den Einsatz in dynamischen, unvorhersehbaren Umgebungen ohne aufwendige Datenaufbereitung.

Source: https://techcrunch.com/2026/04/16/physical-intelligence-a-hot-robotics-startup-says-its-new-robot-brain-can-figure-out-tasks-it-was-never-taught/