KI-Apps containerisieren mit Podman, Docker & Kubernetes
Vom Container zur skalierbaren Inferenz: Images, Deployments, GPU, Security und Betrieb im Cluster
Zu den TerminenWenn ein Modell im Notebook funktioniert, heißt das noch lange nicht, dass es im Betrieb stabil, reproduzierbar und sicher läuft. In diesem Seminar bringst du KI-Anwendungen in eine Form, die Teams zuverlässig ausrollen und betreiben können: als Docker-Container und als Kubernetes-Workloads. Du startest mit dem Aufbau sinnvoller Images für Inferenz und gegebenenfalls Training: Base-Image-Auswahl, Layering, Caching und ein Abhängigkeitsmanagement, das Builds reproduzierbar macht. Danach klärst du, wie Modellartefakte und Daten in der Praxis gehandhabt werden, ohne sie unkontrolliert in Images zu backen, und wie Konfiguration über Environment, ConfigMaps und Secrets sauber getrennt wird. Im nächsten Schritt geht es um Performance und GPU: Du verstehst die Treiber- und CUDA-Kompatibilität, setzt die NVIDIA Container Runtime richtig ein und lernst, wie Requests, Limits und IO die Latenz beeinflussen. Auf Kubernetes-Seite arbeitest du mit Deployments, Services und Ingress, richtest Readiness- und Liveness-Probes ein und gestaltest Rollouts so, dass Modellwechsel nicht zu Ausfällen führen. Du übst Muster wie Canary und Blue-Green, planst Batch-Inferenz als Jobs und denkst über Autoscaling mit HPA nach. Abgerundet wird der Kurs durch Security und Betrieb: Least Privilege, Rootless-Ansätze, Image-Scanning, SBOM, Netzwerk-Policies sowie Metriken und Logs, die dir bei Inferenzproblemen wirklich helfen. Am Ende kannst du eine KI-API containerisieren, im Cluster ausrollen und mit klaren Betriebsroutinen verantworten.
Lernziele
Du lernst in diesem Kurs, wie du KI-Modelle effizient in Container verpackst, GPU-Ressourcen optimal nutzt und stabile Kubernetes-Deployments für den produktiven Betrieb von Inferenz-Workflows und Batch-Jobs aufbaust.
KI-Apps professionell containerisieren
GPU-Workloads und CUDA-Images optimieren
Skalierbare Kubernetes-Deployments nutzen
Sicheres Modell- und Geheimnismanagement
Release-Strategien wie Blue-Green & Canary
Effizientes Monitoring von Inferenz-APIs
Inhalte
Container-Setup für KI-Workloads
Docker-Images für Inferenz und Training: Base-Images, Layering, Caching
Python-Abhängigkeiten reproduzierbar: Wheels, Lockfiles, Build-Strategien
Modellartefakte und Daten: Mounts, Volumes, Object Storage Patterns
Healthchecks, Logging und Konfiguration per Environment
Performance und GPU in Containern
NVIDIA Container Runtime: Voraussetzungen und typische Stolperstellen
CUDA-kompatible Images und Treiber-Matrix verstehen
Batching, Concurrency und Warmup für Inferenz
Ressourcenlimits: CPU, RAM, GPU und IO sinnvoll setzen
Kubernetes-Grundlagen für KI-Services
Pods, Deployments, Services, Ingress: was du wirklich brauchst
ConfigMaps und Secrets: Konfiguration ohne Image-Neubau
Readiness/Liveness: saubere Rollouts ohne Ausfälle
Autoscaling-Grundlagen: HPA, Requests und Limits
Deployment-Muster für Modelle und APIs
REST/gRPC Inferenz-API containerisieren (z. B. FastAPI)
Modellversionierung: Tags, Immutable Images, Registry-Strategie
Blue-Green und Canary Releases für Modellwechsel
Job-Workloads: Batch-Inferenz und Scheduled Jobs
Security, Compliance und Supply Chain
Least Privilege: Rootless, Capabilities, Pod Security
Image-Scanning und SBOM: Risiken sichtbar machen
Secrets Handling: keine Keys im Image, Rotation verstehen
Netzwerk-Policies und sichere Ingress-Konfiguration
Observability und Betrieb
Metriken für KI: Latenz, Throughput, Fehler, Queueing
Logs und Traces: Debugging von Inferenzproblemen
Rollbacks und Incident-Playbooks für Deployments
Kosten- und Kapazitätsdenken: Node Pools, GPU-Auslastung
Zielgruppe
Dieses Seminar richtet sich an ML Engineers und Data Scientists, die Verantwortung für den produktiven Betrieb ihrer Modelle übernehmen. Ebenso profitieren DevOps- und Platform-Engineers sowie Softwareentwickler und IT-Architekten, die moderne KI-Workloads in bestehende IT-Infrastrukturen integrieren und standardisierte Deployment-Prozesse etablieren möchten.
Voraussetzungen
Grundkenntnisse in Linux/CLI und Container-Grundlagen sind hilfreich.
Erste Berührung mit Kubernetes oder Cloud-Networking ist von Vorteil, aber nicht zwingend.
Hintergrund
KI-Apps containerisieren mit Podman, Docker & Kubernetes - häufig gestellte Fragen
Unsere generellen Seminarzeiten sind von 09:00 bis ca. 17:00 Uhr. Wenn du Fragen hast, kontaktieren uns gerne.
Unternehmen in Deutschland, Österreich und der Schweiz, die uns vertrauen
Das sagen unsere Kunden
Wir arbeiten ständig daran uns zu verbessern. Dafür sind wir auf das Feedback unserer Kunden angewiesen.

Kompetentes Online-Training mit Learning by Doing. Besser geht nicht. Jeannette M.
Sehr gute Planung und Organisation aller Microsoft Office Schulungen. Incas Training ist sehr zu empfehlen! Christopher M.
Toller Service. Hatte auf Ihrer Seite KOSTENLOS den Weg gefunden, sämtliche Animationen mit einem Schritt zu entfernen. Hat super geklappt. Vielen lieben Dank dafür. Wenn ich schon nichts bezahlen muss, dann wenigstens eine passenden Bewertung :-) Thomas S.