Unsere gemeinsamen Berufungen und Professuren finden Sie hier: Gemeinsame Berufungen / Professuren

Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs
Stellenbeschreibung
Kennziffer:  4254
Arbeitsort:  Sankt Augustin
Eintrittsdatum:  sofort
Karrierestufe:  Studien- & Abschlussarbeit
Beschäftigungsgrad:  Teilzeit
Dauer der Beschäftigung:  befristet auf 6 Monate

Vergütung: Die Vergütung erfolgt gemäß der jeweils geltenden Tarifverträge des öffentlichen Dienstes (Bund).

Steige ein in die faszinierende Welt des Deutschen Zentrums für Luft- und Raumfahrt e. V. (DLR), um mit Forschung und Innovation die Zukunft mitzugestalten! Mit dem Know-how und der Neugier unserer rund 12.000 Mitarbeitenden aus 100 Nationen sowie unserer einzigartigen Infrastruktur bieten wir ein spannendes und inspirierendes Arbeitsumfeld. Gemeinsam entwickeln wir nachhaltige Technologien und tragen so zur Lösung globaler Herausforderungen bei. Möchtest du diese große Zukunftsaufgabe mit uns zusammen angehen? Dann ist dein Platz bei uns!

Das Institut für den Schutz terrestrischer Infrastrukturen hat die stabile Versorgung der Gesellschaft zum Ziel. Digitale Zwillinge ermöglichen die Überwachung und Reaktion auf Krisen und Angriffe sowie die Analyse und Optimierung der Resilienz terrestrischer Infrastrukturen.

 

Das erwartet dich 

Eine Herausforderung bei der Erstellung digitaler Zwillinge ist die Umwandlung von technischen Dokumentationen, insbesondere von Rohrleitungs- und Instrumentierungsdiagrammen (P&IDs) und elektrischen Schaltplänen, in strukturierte, maschinenlesbare Daten. In dieser Arbeit sollen Methoden erforscht und evaluiert werden, die Textannotationen (Beschriftungen, Notizen, Teilenummern) nutzen, indem Sie Large Language Model (LLM)-Features mit Objektdetektoren kombinieren, die zur Vorhersage von Graphen verwendet werden.

 

Deine Aufgaben

  • Implementierung moderner OCR-Technologie für P&IDs und elektrische Zeichnungen und Aufbau eines Datensatzes (synthetisch + real) für Training und Evaluierung
  • Erstellung eines Tools zum Taggen von Textstrings und den zugehörigen Symbolen, um Ground-Truth-Beziehungstabellen (Text ↔ Objekt) zu erstellen
  • Vergleich und Bewertung verschiedener Ansätze zur Kombination der Textfeatures mit der Symbolerkennung:
    • regelbasierte Methoden, die Distanz, Ausrichtung und domänenspezifische Hinweise verwenden (z. B. „Text, der über einem Symbol platziert ist, beschreibt dieses in der Regel“)
    • Extraktion von semantischen Features aus dem erkannten Text mit einem vortrainierten LLM und Kombinierung mit CNN-Features der Symbole
    • Training eines Classifiers, der Text- und Objekt-features als Eingabe nimmt und eine binäre Ausgabe „related/nicht related“ vorhersagt
    • Erfassung, wissenschaftliche Analyse und Präsentation der Untersuchungsergebnisse

 

Das bringst du mit

  • laufendes Studium in Informatik, Mechatronik, Elektrotechnik oder einem verwandten Fachgebiet
  • Bereitschaft, sich in komplexe Themen einzuarbeiten
  • Grundkenntnisse im Bereich Machine Learning
  • gute Kenntnisse in der Programmierung mit Python
  • selbstständiges Arbeiten
  • gute Kommunikations- und Teamfähigkeiten

Gewünschte Qualifikation:

  • Erfahrung mit Computer Vision-Bibliotheken wie OpenCV, PyTorch oder TensorFlow
  • Grundkenntnisse von LLMs

Das bieten wir dir

Das DLR steht für Vielfalt, Wertschätzung und Gleichstellung aller Menschen. Wir fördern eigenverantwortliches Arbeiten und die individuelle Weiterentwicklung unserer Mitarbeitenden im persönlichen und beruflichen Umfeld. Dafür stehen dir unsere zahlreichen Fort- und Weiterbildungsmöglichkeiten zur Verfügung. Chancengerechtigkeit ist uns ein besonderes Anliegen, wir möchten daher insbesondere den Anteil von Frauen in der Wissenschaft und Führung erhöhen. Bewerbungen schwerbehinderter Menschen bevorzugen wir bei fachlicher Eignung.

Wir freuen uns darauf, dich kennenzulernen!

Fragen zu dieser Position (Kennziffer 4254) beantwortet dir gerne:

Tobias Koch 
Tel.: +49 2241 20148 55