Open-Source LLM Fine-Tuning für Entwickler
Von Datensatz bis Deployment: LoRA, DPO, Evaluation und sichere Inferenz in deiner Umgebung.
Zu den TerminenDu willst LLMs nicht nur nutzen, sondern sie perfekt auf deine spezifischen Anforderungen zuschneiden? In diesem Seminar lernst du, wie du Open-Source-Modelle wie Llama, Mistral oder Qwen professionell optimierst und in deine Infrastruktur integrierst. Wir gehen weit über einfaches Prompting hinaus: Du steigst tief in den kompletten Fine-Tuning-Lifecycle ein – von der strategischen Auswahl des Base Models bis zum sicheren Deployment.
Du meisterst Techniken wie LoRA und QLoRA, um Hardware-Ressourcen effizient zu nutzen, und lernst mit Direct Preference Optimization (DPO), dein Modell präzise auf Nutzerpräferenzen auszurichten. Ein besonderer Schwerpunkt liegt auf der Evaluation: Wir zeigen dir, wie du mit Golden Sets und LLM-as-a-Judge die Qualität deiner Ergebnisse messbar und reproduzierbar machst. Am Ende bringst du dein Modell mit vLLM oder TGI performant in den Betrieb, inklusive Quantisierung und effektivem Schutz gegen Prompt Injection. Werde zum Experten für produktionsreife KI-Lösungen!
Lernziele
Nach diesem Seminar beherrschst du den gesamten Prozess des Fine-Tunings. Du triffst fundierte Entscheidungen zur Modellwahl, optimierst effizient mit PEFT und stellst die Qualität durch professionelle Evaluationsmethoden sicher.
Open-Source LLMs strategisch auswählen
Effizientes Fine-Tuning mit LoRA & QLoRA
Präferenz-Optimierung via DPO umsetzen
Qualität mit LLM-as-a-Judge evaluieren
Modelle mit vLLM/TGI performant bereitstellen
Sicherheitsrisiken wie Prompt Injection minimieren
Inhalte
Modell- und Trainingsstrategie festlegen
Use-Case-Scoping: Chat, RAG, Tool-Use, Klassifikation
Base Model Auswahl: Llama, Mistral, Qwen und Lizenzfallen
Compute-Kalkulation: VRAM, Throughput, Kosten, Zeit
PEFT vs. Full Fine-Tuning: wann sich was lohnt
Daten, die wirklich wirken
Instruction-Datasets: Struktur, Prompt-Formate, Systemregeln
Qualitätssicherung: Dedup, Leakage, Toxicity, PII
Labeling-Workflows: Guidelines, Inter-Annotator-Checks
Data Mixing: Domain, General, Safety, Hard Negatives
Supervised Fine-Tuning (SFT) mit PEFT
LoRA/QLoRA: Rank, Alpha, Target Modules
Tokenisierung, Packing, Sequence Length, Loss Masking
Training mit Hugging Face Transformers + TRL
Stabilität: LR-Schedules, Grad-Accumulation, Checkpoints
Preference Tuning: DPO statt Bauchgefühl
Pairwise Preferences: Datenschema und Sampling
DPO-Grundidee, Beta, Overfitting auf Präferenzen
Alternativen: ORPO, IPO, Best-of-N Sampling
Guardrails: Ablehnungen, Policy-Style, Safety-Prompts
Evaluation, die dich vor Überraschungen schützt
Offline-Eval: Task-Suites, Regression Tests, Golden Sets
LLM-as-a-Judge: Bias, Kalibrierung, Gegenchecks
Halluzinationsmessung in RAG-Setups
Monitoring-Metriken: Drift, Cost per Answer, Latency
Deployment & Betrieb
Export: Adapter-Merge, Quantisierung (GPTQ/AWQ)
Serving: vLLM/TGI, Batching, KV-Cache, Streaming
Security: Prompt Injection, Data Exfiltration, Secrets
Release-Prozess: Modellkarten, Versionierung, Rollback
Zielgruppe
Dieses Seminar richtet sich an Softwareentwickler, Machine Learning Engineers und Data Scientists, die den Schritt von der reinen API-Nutzung zum eigenen, optimierten Modell gehen wollen. Auch MLOps-Teams, die für das Serving und die Sicherheit von KI-Modellen in Produktumgebungen verantwortlich sind, erhalten hier das notwendige Rüstzeug für reproduzierbare und performante Deployments.
Voraussetzungen
Solide Python-Grundlagen und Erfahrung mit CLI/Git.
Grundverständnis von Transformer/Tokenisierung und ML-Training (Begriffe wie Loss, Epoch, Overfitting).
Hintergrund
Open-Source LLM Fine-Tuning für Entwickler - häufig gestellte Fragen
Unsere generellen Seminarzeiten sind von 09:00 bis ca. 17:00 Uhr. Wenn du Fragen hast, kontaktieren uns gerne.
Unternehmen in Deutschland, Österreich und der Schweiz, die uns vertrauen
Das sagen unsere Kunden
Wir arbeiten ständig daran uns zu verbessern. Dafür sind wir auf das Feedback unserer Kunden angewiesen.

Kompetentes Online-Training mit Learning by Doing. Besser geht nicht. Jeannette M.
Sehr gute Planung und Organisation aller Microsoft Office Schulungen. Incas Training ist sehr zu empfehlen! Christopher M.
Toller Service. Hatte auf Ihrer Seite KOSTENLOS den Weg gefunden, sämtliche Animationen mit einem Schritt zu entfernen. Hat super geklappt. Vielen lieben Dank dafür. Wenn ich schon nichts bezahlen muss, dann wenigstens eine passenden Bewertung :-) Thomas S.