4.9 bei Google (55 Bewertungen)

Open-Source-LLMs lokal betreiben: Grundkurs

Richte lokale Inferenz ein, bewerte Modelle und baue sichere Workflows ohne Cloud-Abhängigkeit.

Zu den Terminen

Du möchtest die Power von Large Language Models nutzen, ohne deine sensiblen Daten in die Cloud zu schicken? In unserem Seminar lernst du, wie du Open-Source-LLMs souverän auf deiner eigenen Hardware betreibst. Wir zeigen dir nicht nur, wie du eine lokale Laufzeit stabil einrichtest, sondern auch, wie du durch Quantisierung das Maximum aus deiner CPU und GPU herausholst. Du erfährst, wie Transformer-Modelle im Detail funktionieren und wie du durch präzises Prompting reproduzierbare Ergebnisse im JSON-Format erzwingst. Gemeinsam bauen wir eine lokale RAG-Pipeline auf, damit deine KI auf Basis deiner eigenen Dokumente antwortet – sicher, schnell und unabhängig. Erhalte volle Kontrolle über deine Workflows und etabliere professionelle Routinen für Evaluation und Datenschutz. Starte jetzt durch und mache dich unabhängig von großen Cloud-Anbietern.

Lernziele

In diesem Grundkurs erwirbst du das fundierte Handwerk, um Open-Source-Modelle sicher zu implementieren. Du lernst, lokale Inferenz-Umgebungen zu optimieren und komplexe RAG-Workflows für deine spezifischen Anforderungen erfolgreich umzusetzen.

Lokale Inferenz-Umgebungen sicher einrichten

Quantisierung für CPU und GPU optimieren

Reproduzierbares Prompting im Team etablieren

Strukturierte JSON-Ausgaben präzise erzwingen

Lokale RAG-Pipelines mit eigenen Daten bauen

Evaluation und Versionierung professionell lösen

Inhalte

LLM-Grundlagen für Open-Source-Stacks

  • Transformer, Token, Kontextfenster, Sampling verständlich einordnen

  • Inferenz vs. Training, Quantisierung und ihre Grenzen

  • Modellformate und Laufzeit-Ökosystem: GGUF, safetensors

Lokale Laufzeit einrichten und vergleichen

  • llama.cpp und Ollama: Installation, Modelle, Updates

  • CPU vs. GPU: VRAM, RAM, Durchsatz, Latenz

  • Basis-Tuning: Kontext, Temperatur, Top-p, Wiederholungsstrafen

Prompting, das reproduzierbar funktioniert

  • System-, Entwickler- und Nutzer-Prompts sauber trennen

  • Strukturierte Ausgaben: JSON, Tabellen, feste Schemas

  • Fehlerbilder: Halluzinationen, Prompt Injection, Overconfidence

RAG lokal: Wissen anbinden statt raten

  • Chunking, Embeddings, Retrieval, Re-Ranking als Pipeline

  • Lokale Vektordatenbanken und Dateiquellen (PDF, Markdown)

  • Qualität messen: Trefferquote, Zitierbarkeit, Kontextbudget

Evaluation und Betrieb

  • Qualitätskriterien: Faktentreue, Konsistenz, Stil, Sicherheit

  • Testsets, Prompt-Regression, einfache Benchmarks

  • Logging, Datenschutz, Modell- und Prompt-Versionierung

Use-Cases, Grenzen, nächste Schritte

  • Assistenz für Schreiben, Analyse, Code-Reviews, Support-Entwürfe

  • Wann Cloud-Modelle sinnvoller sind, wann lokal gewinnt

  • Roadmap: Tools, Fine-Tuning-Optionen, Governance

Zielgruppe

Dieser Kurs richtet sich an IT-Administratoren, DevOps-Verantwortliche und Softwareentwickler, die KI-Services souverän im eigenen Unternehmen bereitstellen möchten. Ebenso profitieren IT-Sicherheitsbeauftragte sowie Data Engineers davon, die RAG-Systeme unter strikten Datenschutzaspekten lokal aufbauen und evaluieren müssen.

Voraussetzungen

  • Grundverständnis von IT-Systemen (Dateisystem, Prozesse, Netzwerk) und sicherer Umgang mit der Kommandozeile.

  • Hilfreich sind Basiskenntnisse in Python oder einer Skriptsprache, aber nicht zwingend.

Hintergrund

Der Grundkurs Open Source LLMs lokal betreiben bringt dich weiter, weil du lernst, KI Modelle im eigenen Umfeld bereitzustellen und zu betreiben statt dich auf externe Dienste zu verlassen. Dein Benefit ist volle Datenkontrolle bei sensiblen Informationen, klar planbare Kosten durch lokale Infrastruktur sowie mehr Stabilität und Anpassbarkeit für Entwickler und Administratoren, etwa bei Deployment, Updates und Betrieb im Team. So setzt du Open Source LLMs lokal betreiben praxisnah um und machst KI im Unternehmen schneller produktiv.

Häufig gestellte Fragen

Für den lokalen Betrieb von Open Source LLMs ist die Hardwareauswahl der wichtigste Kosten- und Erfolgsfaktor. In der Praxis gilt: Für erste Tests, Administration und kleine Modelle reicht eine moderne CPU-Umgebung häufig aus – für flüssige Inferenz, höhere Tokenraten und größere Modelle ist eine dedizierte GPU mit ausreichend VRAM entscheidend. Wenn Sie Open Source LLMs lokal betreiben möchten, sollten Sie vorab klären: (1) Welche Modellgröße (z. B. 7B/13B/… Parameter) ist realistisch? (2) Welche Quantisierung (z. B. 4-bit/8-bit) kommt infrage? (3) Wie viele parallele Nutzer/Requests planen Sie? Für viele Unternehmens-Setups ist eine GPU-basierte Workstation oder ein Server mit NVIDIA-GPU der Standard, während CPU-only eher für Proof of Concept, kleinere Modelle oder Batch-Jobs geeignet ist. Das Seminar „Open Source LLMs lokal betreiben – Grundkurs“ hilft Ihnen, diese Entscheidungen fundiert zu treffen, damit Ihr lokales LLM-Setup performant, stabil und wirtschaftlich bleibt.

Unternehmen in Deutschland, Österreich und der Schweiz, die uns vertrauen

Lufthansa Logo
BMW Logo
Bundeswehr Logo
Logo der ARD Gruppe
Zalando Logo
Volkswagen Logo

Das sagen unsere Kunden

Wir arbeiten ständig daran uns zu verbessern. Dafür sind wir auf das Feedback unserer Kunden angewiesen.

Kompetentes Online-Training mit Learning by Doing. Besser geht nicht. Jeannette M.

Sehr gute Planung und Organisation aller Microsoft Office Schulungen. Incas Training ist sehr zu empfehlen! Christopher M.

Toller Service. Hatte auf Ihrer Seite KOSTENLOS den Weg gefunden, sämtliche Animationen mit einem Schritt zu entfernen. Hat super geklappt. Vielen lieben Dank dafür. Wenn ich schon nichts bezahlen muss, dann wenigstens eine passenden Bewertung :-) Thomas S.