Estimating the Pose of a Euro Pallet with an RGB Camera based on Synthetic Training Data

Markus Knitt; Jakob Schyga; Asan Adamanov; Johannes Hinckeldeyn; Jochen Kreutzfeldt

doi:10.2195/lj_proc_knitt_en_202211_01

Autor/innen

Markus Knitt Institute for Technical Logistics, Hamburg University of Technology
Jakob Schyga Institute for Technical Logistics, Hamburg University of Technology
Asan Adamanov Institute for Technical Logistics, Hamburg University of Technology
Johannes Hinckeldeyn Institute for Technical Logistics, Hamburg University of Technology
Jochen Kreutzfeldt Institute for Technical Logistics, Hamburg University of Technology

DOI:

https://doi.org/10.2195/lj_proc_knitt_en_202211_01

Schlagworte:

6D pose estimation, 6D-Posenschätzung, DOPE algorithm, DOPE-Algorithmus, Europalette, RGB camera, RGB-Kamera, Synthetischer Trainingsdatensatz, euro pallet, synthetic training dataset

Abstract

Posenschätzung einer Palette und anderer Logistikobjekte ist von entscheidender Bedeutung für verschiedene Anwendungsfälle, wie automatisiertes Handling oder Tracking. Innovationen in der Bilderkennung, Rechenleistung und maschinellem Lernen eröffnen kamerabasierten Ansätzen auf Basis neuronaler Netze neue Möglichkeiten für die gerätelose Lokalisierung. Hierfür werden große Trainingsdatensätze mit annotierten Posen benötigt. Die manuelle Annotation, insbesondere von 6D-Posen, ist ein äußerst arbeitsintensiver Prozess, weshalb neuere Ansätze oftmals auf synthetischen Trainingsdaten basieren. In dieser Arbeit wird die Generierung synthetischer Trainingsdaten für die 6D-Posenschätzung von Paletten vorgestellt. Anschließend werden die Daten verwendet, um den Deep Object Pose Estimation (DOPE)-Algorithmus [1] zu trainieren. Die ex¬perimentelle Validierung des Algorithmus belegt, dass die 6D-Posenschätzung einer Europalette mit einer Rot-Grün-Blau (RGB) Kamera möglich ist. Der Vergleich der Ergebnisse von drei variierenden Datensätzen unter verschiedenen Lichtverhältnissen zeigt die Relevanz eines geeigneten Datensatzdesigns, um eine genaue und robuste Lokalisierung zu erreichen. Die quantitative Auswertung zeigt für den bevorzugten Datensatz einen durchschnittlichen Positionsfehler von weniger als 20 cm. Der validierte Trainingsdatensatz und ein fotorealistisches Modell einer Europalette sind öffentlich zur Verfügung gestellt [2].

Estimating the Pose of a Euro Pallet with an RGB Camera based on Synthetic Training Data

Autor/innen

DOI:

Schlagworte:

Abstract

Downloads

Veröffentlicht

Zitationsvorschlag

Ausgabe

Rubrik

Lizenz

Aktuelle Ausgabe

Sprache