CD-Labor for Semantische 3D Computer Vision

Für eine intuitive Interaktion zwischen Mensch und Computer muss der Computer auch abschätzen können, wo im dreidimensionalen Raum sich eine Hand befindet.

Roboter dringen in immer mehr Bereiche unseres Lebens vor. Ziel dieses CD-Labors ist es, Roboter in die Lage zu versetzen, sich in einer nicht standardisierten Umgebung selbständig zu orientieren und bestimmte Aufgaben auszuführen.

 

Die computergesteuerte Bilderkennung versetzt einen Roboter in die Lage, zu erkennen, wo er sich befindet, welches Objekt er handhaben soll und wo sich dieses relativ zu ihm selbst befindet. Nicht zuletzt aufgrund unzureichender Rechnerleistung wurde bisher versucht, Robotern ihre Umgebung auf Basis zweidimensionaler Bilder zu beschreiben und es gibt zahlreiche Arbeiten zur Standardisierung der Beschreibung visueller Information. Problematisch ist jedoch, dass die zugrundeliegenden Bilder zahlreichen Störungen bzw. Abweichungen unterliegen können, welche die selbständige Verarbeitung durch den Roboter erschweren. Bei Außenaufnahmen kann das Wetter, die Tages- oder Jahreszeit variieren, Aufnahmen können scharf oder unscharf sein, Zielobjekte können sich sehr ähnlich sein und somit nur schwer ganz spezifisch beschreiben lassen und manchmal ist das Ziel auch der leere Raum zwischen zahlreichen Objekten, der sich nur schwer deskriptiv erfassen lässt. Deshalb bewähren sich Roboter bislang hauptsächlich in einer kontrollierten Umgebung. Mittlerweile steht jedoch ausreichend Rechnerleistung zur Verfügung um eine Bildbeschreibung in 3D und somit eine selbständige Umgebungserkennung durch Roboter in einer reellen, unkontrollierten Umgebung möglich zu machen.

 

Eine der meistversprechenden Anwendungen von Computer Vision ist die robotergestützte Wartung in Fabriken. Auch die Positionserkennung im Außenbereich könnte die Genauigkeit von GPS weit übertreffen. Derzeit werden solche Anwendungen mühsam mit der Hand programmiert bzw. durch den Roboter durch Wiederholungen erlernt und sind sehr fehleranfällig und wenig flexibel. Statistische Methoden, welche in Big Data und Machine Learning bereits jetzt zur Anwendung kommen, könnten hier eine leistungsstarke Möglichkeit bieten. Machine Learning Techniken sind jedoch derzeit noch nicht in der Lage, Aufgaben, wie die Bestimmung der Lage eines Objekts in 3D zu lösen. Ziel dieses CD-Labors ist es, die Lücke zwischen Machine Learning Techniken und der geometrischen Computer Vision zu schließen. Dabei sollen statistische Algorithmen als fundamentale Bausteine für Applikationen der 3D Computer Vision entwickelt werden. Dabei soll eine ausreichende Balance zwischen der Genauigkeit der Ergebnisse und der Geschwindigkeit ihrer Berechnung gewährleistet sein.

Die Forschungsarbeit wird dabei auf verschiedene Kameratypen und Sensoren zur Umgebungs- und Lageerkennung, sowie Bewegungs- und Beschleunigungs-sensoren und Kompasse setzen, um dem Roboter eine vielfältige Datenquelle zur Positionsbestimmung auch bei hoher Geschwindigkeit zu erschließen. Weiters sollen Wege gefunden werden, eine automatisierte Positions-erkennung auf Basis verfügbarer Bilddatenbanken, wie z.B. Google Street View, bzw. durch Nutzung zweidimensionaler Quellen, wie Landkarten und Stadtpläne, zu ermöglichen.

 

Ziel ist es zu erreichen, dass Roboter und Machine Learning Techniken das Labor verlassen und ihre vielfältigen Möglichkeiten auch in einer unkontrollierten Umgebung entfalten können.

Ein Computer "lernt", seine Umgebung im Freiland zu verstehen und zu interpretieren.

Christian Doppler Forschungsgesellschaft

Boltzmanngasse 20/1/3 | 1090 Wien | Tel: +43 1 5042205 | Fax: +43 1 5042205-20 | office@cdg.ac.at

© 2020 Christian Doppler Forschungsgesellschaft