Estimating the Pose of a Euro Pallet with an RGB Camera based on Synthetic Training Data

Autor/innen

  • Markus Knitt Institute for Technical Logistics, Hamburg University of Technology
  • Jakob Schyga Institute for Technical Logistics, Hamburg University of Technology
  • Asan Adamanov Institute for Technical Logistics, Hamburg University of Technology
  • Johannes Hinckeldeyn Institute for Technical Logistics, Hamburg University of Technology
  • Jochen Kreutzfeldt Institute for Technical Logistics, Hamburg University of Technology

DOI:

https://doi.org/10.2195/lj_proc_knitt_en_202211_01

Schlagworte:

6D pose estimation, 6D-Posenschätzung, DOPE algorithm, DOPE-Algorithmus, Europalette, RGB camera, RGB-Kamera, Synthetischer Trainingsdatensatz, euro pallet, synthetic training dataset

Abstract

Posenschätzung einer Palette und anderer Logistikobjekte ist von entscheidender Bedeutung für verschiedene Anwendungsfälle, wie automatisiertes Handling oder Tracking. Innovationen in der Bilderkennung, Rechenleistung und maschinellem Lernen eröffnen kamerabasierten Ansätzen auf Basis neuronaler Netze neue Möglichkeiten für die gerätelose Lokalisierung. Hierfür werden große Trainingsdatensätze mit annotierten Posen benötigt. Die manuelle Annotation, insbesondere von 6D-Posen, ist ein äußerst arbeitsintensiver Prozess, weshalb neuere Ansätze oftmals auf synthetischen Trainingsdaten basieren. In dieser Arbeit wird die Generierung synthetischer Trainingsdaten für die 6D-Posenschätzung von Paletten vorgestellt. Anschließend werden die Daten verwendet, um den Deep Object Pose Estimation (DOPE)-Algorithmus [1] zu trainieren. Die ex¬perimentelle Validierung des Algorithmus belegt, dass die 6D-Posenschätzung einer Europalette mit einer Rot-Grün-Blau (RGB) Kamera möglich ist. Der Vergleich der Ergebnisse von drei variierenden Datensätzen unter verschiedenen Lichtverhältnissen zeigt die Relevanz eines geeigneten Datensatzdesigns, um eine genaue und robuste Lokalisierung zu erreichen. Die quantitative Auswertung zeigt für den bevorzugten Datensatz einen durchschnittlichen Positionsfehler von weniger als 20 cm. Der validierte Trainingsdatensatz und ein fotorealistisches Modell einer Europalette sind öffentlich zur Verfügung gestellt [2].

Downloads

Veröffentlicht

02.11.2022

Zitationsvorschlag

Knitt, M., Schyga, J., Adamanov, A., Hinckeldeyn, J., & Kreutzfeldt, J. (2022). Estimating the Pose of a Euro Pallet with an RGB Camera based on Synthetic Training Data. Logistics Journal: Proceedings, (18). https://doi.org/10.2195/lj_proc_knitt_en_202211_01