Der Schwerpunkt des DLR-Instituts für Datenwissenschaften in Jena liegt darin, Lösungen für die neuen Herausforderungen der Digitalisierungsära zu finden. Die Forschung konzentriert sich dabei auf die Bereiche Datenmanagement, Datenanalyse und Datengewinnung. Entsprechend der thematischen Ausrichtung des Instituts wurden drei Abteilungen eingerichtet.
In der Abteilung Datenanalyse und -intelligenz werden Methoden entwickelt und angewandt, die die Analyse komplexer und großer Datensätze ermöglichen. Hier wird auf Verfahren des Maschinellen Lernens, der Kausalen Inferenz sowie domänenspezifisches Prozesswissen zurückgegriffen. Zur Steigerung des Technologietransferpotentials werden bei der Anwendungsentwicklung Human Factors wie Akzeptanz berücksichtigt.
Das erwartet dich
In der Arbeitsgruppe „Maschinelles Lernen“ erforschen und entwickeln wir innovative datengetriebene Methoden zur Datenanalyse und finden in Kooperation mit anderen DLR-Instituten Lösungen für praktische Anwendungsfälle mittels maschineller Lernverfahren.
Wir bieten Ihnen im Rahmen unserer Arbeitsgruppe die Möglichkeit eine Abschlussarbeit oder eine studentische Tätigkeit im Bereich des Maschinellen Lernen, spezieller zu dem Thema Modellreduktion für Basismodell, wie z.B. Large Language Modelle in Kombination mit datenschutzkonformen Methoden. Als Teil eines internationalen Teams ist es Ihre Aufgabe dabei zu helfen neue Methoden zu entwerfen, zu implementieren und zu evaluieren.
Deine Aufgaben
-
- Implementierung und Test von LLM-Kompressionsmethoden wie Pruning, Quantisierung und Low-Rank Adaptation (LoRA).
- Durchführung von Experimenten mit Open-Source-LLMs wie LLaMA, Phi, Mistral, Gemma oder Qwen.
- Evaluation komprimierter Modelle auf Benchmarks für Reasoning, Fragebeantwortung und Sprachverständnis.
- Unterstützung von Experimenten zu datenschutzfreundlichen KI-Verfahren wie Federated Learning, Differential Privacy, Secure Inference oder homomorpher Verschlüsselung.
- Lektüre und Zusammenfassung aktueller Forschungsarbeiten zu effizienten und vertrauenswürdigen LLMs.
- Mitarbeit an internen Tools zur LLM-Kompression und -Auswertung.
- Testdurchführung und Dokumentation der Arbeit, einschließlich der Erstellung von Skripten, Experimentprotokollen, Diagrammen und Ergebnistabellen.
Im Rahmen einer studentischen Tätigkeit erbringst du deine Arbeitsleitung in einem Umfang von bis zu 20 Stunden pro Woche. Die genaue Eingrenzung des Themas einer Abschlussarbeit erfolgt gemeinsam mit dir entsprechend deiner speziellen Qualifikationen und Erwartungen.
Das bringst du mit
- laufendes Studium der Informatik, Mathematik, Physik, Data Science oder verwandten Fachrichtungen
- grundlegende Kenntnisse aus der Mathematik (Analysis, Lineare Algebra, Stochastik, Logik)
- Solide Programmierkenntnisse in Python
- Vertrautheit mit PyTorch, Hugging Face Transformers und ähnlichen Bibliotheken.
- Interesse an Large Language Models, vertrauenswürdigen und effizienten KI-Systemen.
- Gute Englischkenntnisse.
- Nachweis abgeschlossener Projekte, z. B. aus dem Studium, Praktika usw.
Wir freuen uns darauf, dich kennenzulernen!
Fragen zu dieser Position (Kennziffer 5387) beantwortet dir gerne:
Prof. Christian Thiel
Tel.: +49 3641 30960 128