Semantic-Aware Terrain Traversability Analysis Using LLMs

Montag, 1. Juli 2024

Für Navigation und Pfadplanung in unstrukturierten Umgebungen benötigen Roboter Kenntnisse über die Traversierbarkeit des Geländes, auf dem sie gerade laufen oder fahren.
Ein einfaches Beispiel ist ein Roboter mit einem Laserscanner, der anhand der aufgenommenen Punktewolke Hindernisse wie Bäume erkennen und somit auch umgehen kann.
Aber was ist, wenn die aufgenommenen Umgebungseigenschaften nicht so einfach bewertet werden können? Hohes Gras zum Beispiel wird von einem Lasersensor als Hindernis erkannt. Nutzt der Roboter Kameras, kann er z.B. mit Hilfe von Deep Learning erkennen, dass es sich um Gras handelt. Aber ist das erkannte Gras nun wirklich traversierbar, oder doch vielleicht zu dicht und unwegsam für den kleinen Roboter? Auch das kann erlernt werden, aber hier müsste man auf diverse Sonderfälle achten und diese möglichst gut in einem Trainings-Datensatz abbilden.
Für solche speziellen Probleme könnten Large Language Models (kurz LLMs, ein bekanntes Beispiel ist ChatGPT) zur Lösung beitragen: LLMs gehören zur Familie der  sogenannten „Foundation Models“, die auf riesigen allgemeinen Datensätzen vortrainiert  werden und so über eine Art „Weltwissen“ verfügen. Kann man diese Modelle nutzen, um Traversierbarkeits-Analyse in schwierigen Umgebungen zu verbessern? Und wenn ja, wie? Mit diesen und weiteren Fragen rund um Foundation Models beschäftigt sich meine hier vorgestellte Masterarbeit.

Studenten:

 

 

• Ida Germann