KI-Forscher testen die Geschicklichkeit eines Roboters, indem sie ihm einen Rubik-Würfel geben

KI-Forscher testen die Geschicklichkeit eines Roboters, indem sie ihm einen Rubik-Würfel geben

31. Juli 2019 0 Von Horst Buchwald

KI-Forscher testen die Geschicklichkeit eines Roboters, indem sie ihm einen Rubik-Würfel geben

New York, 30.7.2019

Menschen können Rubiks Würfel mit Leichtigkeit manipulieren – im Gegensatz zu Robotern. Nun hat eine Gruppe von Forschern von Tencent und der Chinese University of Hong Kong den Würfelmanipulator von Rubik entwickelt. Er setzt Multifingerhände ein. In einem Beitrag auf dem Preprintserver Arxiv.org („Learning to Solve a Rubik’s Cube with a Dexterous Hand“) behaupten sie, dass ihr AI-gesteuertes System – bestehend aus einem Würfellöser, der optimale Bewegungsabläufe identifiziert, und einem Würfelbetreiber, der bis zu fünf Finger steuert – eine durchschnittliche Erfolgsquote von 90,3% über 1.400 Versuche erreicht.

„Geschickte Manipulation in der Hand ist ein wichtiger Baustein für Roboter, um Geschicklichkeit auf menschlicher Ebene zu erreichen und alltägliche Aufgaben zu erledigen, die mit viel Kontakten verbunden sind“, schrieben die Forscher. Sie ergänzen jedoch: „Trotz dieser Fortschritte ist die zuverlässige, gekonnte Handhabe mit mehreren Fingern aufgrund ihrer komplexen Kontaktmuster, ihres hochdimensionalen Aktionsraums und ihrer empfindlichen mechanischen Struktur eine offene Herausforderung geblieben.“

Die Lösung des Teams ist ein hierarchisches System, das modellbasierte und modellfreie Planungs- und Manipulationskomponenten kombiniert. Der Würfellöser findet eine optimale Bewegungssequenz für die Wiederherstellung des Rubik-Würfels, während die Steuerung – die aus zwei getrennten Aktionen besteht (der Würfelrotation und einer lagenweisen Operation) – jede Bewegung Schritt für Schritt ausführt.

Das Team stellt fest, dass die Kinematik und die Gelenkbewegungen einige Bewegungen schwieriger zu vollziehen machen als andere. Um ihre Zuverlässigkeit quantitativ zu vergleichen, trainierten sie separat mehrere Modelle. Und um die Robustheit der Würfelrotation und der lagenweisen Operationen zu verbessern, die nacheinander ohne Rückmeldungen durchgeführt werden, implementierten sie einen Rollback-Mechanismus, der bei jedem Schritt den Status des Rubik-Würfels überprüft.

Das Team nutzte die Multi-Joint Dynamik von Roboti mit Contact (Mujoco), einer Physik-Engine für Forschung und Entwicklung in der Robotik und Biomechanik, um ihren Ansatz zu validieren. Innerhalb von Mujoco klopften sie an einen geschickten, menschengroßen Manipulator namens Shadow Hand, der Mittel- und Ringfinger mit je drei betätigten und einem unterbetätigten Gelenk sowie einen kleinen Finger und Daumen mit fünf betätigten Gelenken (plus ein Handgelenk mit zwei betätigten Gelenken) hat. In einem Experiment wurde Shadow Hand damit beauftragt, den Würfel eines virtuellen Rubiks zu manipulieren, um eine Zielposition zu erreichen, und in einem anderen musste es zwei Ebenen manipulieren, um einen Zielwinkel zu erreichen.

Die Forscher berichten, dass ihr Modell eine stabile Würfelrotationserfolgsrate von über 90% (die sie nach dem Training für 30.000 Episoden auf 95,2% erhöhten) und eine durchschnittliche schichtweise Betriebserfolgsrate von 90,3% (für 1.000 Mal mit randomisierten Block-Posen) erreicht hat. Die Leistung könnte weiter verbessert werden, indem man gemeinsam die beiden Aktionen optimiert und das System auf echter Hardware einsetzt.