
Dieses CD-Labor untersucht verschiedene Lösungsansätze für möglichst präzise und effiziente Personen- und Objekterkennung in so unterschiedlichen Kontexten wie Authentifizierung von Veranstaltungsbesucher*innen bis zur Erkennung gefälschter Markenprodukte.
In vielen bisherigen Szenarien unterscheiden sich die biometrische Personenerkennung und die Erkennung physischer Objekte anhand ihrer (Mikro-)Oberflächenstruktur grundsätzlich stark, obgleich beide auf Methoden der Bildverarbeitung und Computer Vision aufbauen und in den Bereichen Mustererkennung und Machine Learning verwurzelt sind: Typischerweise wird erstere für die Erkennung verschiedener Instanzen von Menschen (also verschiedener Personen) genutzt, beispielsweise für die Einlassregelung bei Sportstadien oder Fahrgeschäften in Vergnügungsparks, während letztere eher zwischen gänzlich verschiedenen Objekttypen (wie Autos und Flugzeugen, oder auch Autos und der Straße, auf der sie fahren) differenziert.
Wenn aber auch Anwendungsfälle wie die Unterscheidung zwischen originalen und gefälschten Markenprodukten hinzukommen, wird die Objekterkennung komplexer, da sie nun zwei Instanzen desselben Objekttyps einander gegenüberstellen muss. Und während hier zumindest das Ergebnis nur auf eine binäre Klassifizierung als „Original“ oder „Fälschung“ hinausläuft, gestaltet es sich noch einmal herausfordernder, etwa verschiedene Exemplare des gleichen Produkts innerhalb einer automatisierten Produktionskette miteinander zu vergleichen.
Das CD-Labor forscht daher in verschiedene Richtungen, um zur Weiterentwicklung von sowohl Personen- als auch Objekterkennung beizutragen. Bei ersterem Bereich sollen etwa elegantere Möglichkeiten zum Einlass in Sportstadien ermöglicht werden: Anstatt langer Wartezeiten, während denen sich Besucher*innen lange bei automatisierten Toren anstellen müssen, um dann erst per Gesichtserkennung sukzessive einzeln Zutritt gewährt zu bekommen, sollen die Besucher*innen bereits während des Anstellens visuell nachverfolgt werden, sodass die Gesichtserkennung bereits abgeschlossen ist, sobald sie das Tor erreichen – eine deutliche Beschleunigung des Vorgangs.
Für diesen Ansatz muss Gesichtserkennung also in ein multi-sensorisches, Multi-Gesichts-Nachverfolgungs-System integriert werden: Um hier eine passende Ausgewogenheit mit möglichst wenig Rechenaufwand und Entscheidungsverzögerung auf der einen und möglichst hoher Erkennungsgenauigkeit auf der anderen Seite zu finden, werden im CD-Labor verschiedene neuartige Ansätze realisiert und verglichen. Für die Forschung im Bereich der Objekterkennung wird dagegen einerseits mit Smartphone-Kameras ein bewusst realitätsnahes Set-up genutzt: So soll etwa ermöglicht werden, dass Endnutzer*innen mittels ihrer eigenen Handys verifizieren können, ob ein Produkt original oder (gerade im Bereich von Medizin potentiell lebensgefährlich) gefälscht ist. Doch damit auch Handykameras mit ihren sehr stark nachbearbeiteten Aufnahmen diese komplexe Aufgabe leisten können, ist freilich ebenfalls umfangreiche Forschung als Basis vonnöten. Andererseits wird die visuelle Oberflächenstruktur von menschlichen Zähnen untersucht und werden Verfahren entwickelt, wie unterschiedliche Zähne einer Person und Zähne von verschiedenen Personen anhand ihrer Oberflächenstruktur unterschieden werden können.
Von der Arbeit des CD-Labors wird also eine große Bandbreite an Personen und Wirtschafts- und Industriezweigen – von Produktionsfirmen bis Konsument*innen, von Veranstaltungsbesucher*innen bis Veranstalter*innen – hinsichtlich Komfort, Effizienz und Sicherheit profitieren.
Boltzmanngasse 20/1/3 | 1090 Wien | Tel: +43 1 5042205 | Fax: +43 1 5042205-20 | office@cdg.ac.at