4.9 bei Google (55 Bewertungen)

Open-Source LLM Fine-Tuning für Entwickler

Von Datensatz bis Deployment: LoRA, DPO, Evaluation und sichere Inferenz in deiner Umgebung.

Zu den Terminen

Du willst LLMs nicht nur nutzen, sondern sie perfekt auf deine spezifischen Anforderungen zuschneiden? In diesem Seminar lernst du, wie du Open-Source-Modelle wie Llama, Mistral oder Qwen professionell optimierst und in deine Infrastruktur integrierst. Wir gehen weit über einfaches Prompting hinaus: Du steigst tief in den kompletten Fine-Tuning-Lifecycle ein – von der strategischen Auswahl des Base Models bis zum sicheren Deployment.

Du meisterst Techniken wie LoRA und QLoRA, um Hardware-Ressourcen effizient zu nutzen, und lernst mit Direct Preference Optimization (DPO), dein Modell präzise auf Nutzerpräferenzen auszurichten. Ein besonderer Schwerpunkt liegt auf der Evaluation: Wir zeigen dir, wie du mit Golden Sets und LLM-as-a-Judge die Qualität deiner Ergebnisse messbar und reproduzierbar machst. Am Ende bringst du dein Modell mit vLLM oder TGI performant in den Betrieb, inklusive Quantisierung und effektivem Schutz gegen Prompt Injection. Werde zum Experten für produktionsreife KI-Lösungen!

Lernziele

Nach diesem Seminar beherrschst du den gesamten Prozess des Fine-Tunings. Du triffst fundierte Entscheidungen zur Modellwahl, optimierst effizient mit PEFT und stellst die Qualität durch professionelle Evaluationsmethoden sicher.

Open-Source LLMs strategisch auswählen

Effizientes Fine-Tuning mit LoRA & QLoRA

Präferenz-Optimierung via DPO umsetzen

Qualität mit LLM-as-a-Judge evaluieren

Modelle mit vLLM/TGI performant bereitstellen

Sicherheitsrisiken wie Prompt Injection minimieren

Inhalte

Modell- und Trainingsstrategie festlegen

  • Use-Case-Scoping: Chat, RAG, Tool-Use, Klassifikation

  • Base Model Auswahl: Llama, Mistral, Qwen und Lizenzfallen

  • Compute-Kalkulation: VRAM, Throughput, Kosten, Zeit

  • PEFT vs. Full Fine-Tuning: wann sich was lohnt

Daten, die wirklich wirken

  • Instruction-Datasets: Struktur, Prompt-Formate, Systemregeln

  • Qualitätssicherung: Dedup, Leakage, Toxicity, PII

  • Labeling-Workflows: Guidelines, Inter-Annotator-Checks

  • Data Mixing: Domain, General, Safety, Hard Negatives

Supervised Fine-Tuning (SFT) mit PEFT

  • LoRA/QLoRA: Rank, Alpha, Target Modules

  • Tokenisierung, Packing, Sequence Length, Loss Masking

  • Training mit Hugging Face Transformers + TRL

  • Stabilität: LR-Schedules, Grad-Accumulation, Checkpoints

Preference Tuning: DPO statt Bauchgefühl

  • Pairwise Preferences: Datenschema und Sampling

  • DPO-Grundidee, Beta, Overfitting auf Präferenzen

  • Alternativen: ORPO, IPO, Best-of-N Sampling

  • Guardrails: Ablehnungen, Policy-Style, Safety-Prompts

Evaluation, die dich vor Überraschungen schützt

  • Offline-Eval: Task-Suites, Regression Tests, Golden Sets

  • LLM-as-a-Judge: Bias, Kalibrierung, Gegenchecks

  • Halluzinationsmessung in RAG-Setups

  • Monitoring-Metriken: Drift, Cost per Answer, Latency

Deployment & Betrieb

  • Export: Adapter-Merge, Quantisierung (GPTQ/AWQ)

  • Serving: vLLM/TGI, Batching, KV-Cache, Streaming

  • Security: Prompt Injection, Data Exfiltration, Secrets

  • Release-Prozess: Modellkarten, Versionierung, Rollback

Zielgruppe

Dieses Seminar richtet sich an Softwareentwickler, Machine Learning Engineers und Data Scientists, die den Schritt von der reinen API-Nutzung zum eigenen, optimierten Modell gehen wollen. Auch MLOps-Teams, die für das Serving und die Sicherheit von KI-Modellen in Produktumgebungen verantwortlich sind, erhalten hier das notwendige Rüstzeug für reproduzierbare und performante Deployments.

Voraussetzungen

  • Solide Python-Grundlagen und Erfahrung mit CLI/Git.

  • Grundverständnis von Transformer/Tokenisierung und ML-Training (Begriffe wie Loss, Epoch, Overfitting).

Hintergrund

Open-Source LLM Fine-Tuning für Entwickler - häufig gestellte Fragen

Unsere generellen Seminarzeiten sind von 09:00 bis ca. 17:00 Uhr. Wenn du Fragen hast, kontaktieren uns gerne.

Unternehmen in Deutschland, Österreich und der Schweiz, die uns vertrauen

Lufthansa Logo
BMW Logo
Bundeswehr Logo
Logo der ARD Gruppe
Zalando Logo
Volkswagen Logo

Das sagen unsere Kunden

Wir arbeiten ständig daran uns zu verbessern. Dafür sind wir auf das Feedback unserer Kunden angewiesen.

Kompetentes Online-Training mit Learning by Doing. Besser geht nicht. Jeannette M.

Sehr gute Planung und Organisation aller Microsoft Office Schulungen. Incas Training ist sehr zu empfehlen! Christopher M.

Toller Service. Hatte auf Ihrer Seite KOSTENLOS den Weg gefunden, sämtliche Animationen mit einem Schritt zu entfernen. Hat super geklappt. Vielen lieben Dank dafür. Wenn ich schon nichts bezahlen muss, dann wenigstens eine passenden Bewertung :-) Thomas S.