🔄 Update — 19. Juni 2026: Microsoft startet „Foundry Local“ und „Foundry Labs“

Microsoft erweitert die lokale Agenten-Ausführung durch die offizielle Vorschau von „Foundry Local“ auf Azure Local, wodurch Inferenz und Multi-Agenten-Workflows vollständig on-device und ohne Cloud-Abhängigkeiten laufen. Zeitgleich startet „Foundry Labs“ als neues Portal für experimentelle, interaktive KI-Szenarien, wie etwa Code-Reasoning auf Repository-Ebene.

Was ist neu?

Foundry Local: Unterstützung für lokale Modellinferenz und Multi-Agenten-Systeme direkt auf Azure Local-Hardware, um vollständige Datenhoheit im On-Premises-Betrieb zu gewährleisten.
Foundry Labs: Ein öffentliches Portal zur Demonstration komplexer, experimenteller KI-Workflows, darunter Code-Verständnis im großen Maßstab und biologische Strukturvorhersagen.

Warum es den Artikel ergänzt

Diese Erweiterungen untermauern die These des Artikels, dass Microsofts Hybrid-Strategie den Übergang von Cloud-Only-Diensten zu vollständig kontrollierbaren, hybriden Multi-Agenten-Architekturen maßgeblich vorantreibt.

Microsoft erweitert Azure AI Foundry um lokale Bereitstellungen und Multi-Agenten-Beschleuniger

Zusammenfassung

Microsoft baut die Präsenz von Azure AI Foundry (ehemals Azure AI Studio) im Hybrid- und Enterprise-Bereich erheblich aus. Mit der Ankündigung von „Foundry Local auf Azure Local“ können Unternehmen Arc-fähige Kubernetes-Cluster nutzen, um KI-Modelle vollständig lokal auszuführen. Dies sichert Datenhoheit und ermöglicht Inferenz mit minimaler Latenz. Parallel dazu stellt Microsoft den „Azure AI Agent Accelerator“ bereit – ein Entwickler-Template, das die Orchestrierung komplexer Multi-Agenten-Systeme vereinfacht.

Was ist passiert?

Foundry Local auf Azure Local: Microsoft hat ein neues lokales Deployment-Modell als Azure Arc-Erweiterung in der Vorschau (Preview) veröffentlicht. Damit lassen sich KI-Modelle auf lokaler Infrastruktur unter Kubernetes-nativem Betrieb (CPU und GPU) ausführen.
Multi-Agenten-Beschleuniger: Eine neue Community-Initiative und Video-Tutorials dokumentieren die Entwicklung kollaborativer Agenten-Netzwerke mithilfe des Azure AI Agent Accelerator.
Sicherheits- und Zugriffssteuerungen: Lokale Endpunkte werden über API-Schlüssel, TLS und Microsoft Entra ID abgesichert, um Enterprise-Sicherheitsanforderungen in hybriden und physisch getrennten Netzwerken zu erfüllen.
Katalogsynchronisierung: Die Plattform synchronisiert Modellmetadaten aus dem globalen Azure AI Foundry-Katalog, um Konsistenz bei der Modellauswahl zu gewährleisten.

Warum es wichtig ist

Im Enterprise-Bereich stehen Datenschutz, Governance und Latenz oft im Konflikt mit rein Cloud-basierten KI-Diensten. „Foundry Local auf Azure Local“ löst dieses Dilemma, indem es das Cloud-Entwicklungsmodell auf On-Premises-Infrastrukturen bringt. Gleichzeitig zeigt die Einführung des Agent-Accelerators, dass sich die Branche von monolithischen Chat-Assistenten hin zu dezentralen, spezialisierten Agenten-Teams entwickelt, die komplexe Geschäftsprozesse autonom bearbeiten.

Beweise

Offizielle Dokumentation: Die offizielle Microsoft Learn-Dokumentation beschreibt die Architektur und Voraussetzungen für Foundry Local.
Entwickler-Discussions: GitHub-Diskussionen im Repository von Microsoft Foundry zeigen eine starke Nachfrage nach lokalen Deployments für Student- und Custom-Modelle im Vergleich zu teuren Cloud-Instanzen.
Video-Ressourcen: Ein detailliertes YouTube-Tutorial führt Entwickler durch das Aufsetzen von Multi-Agenten-Systemen.

Analyse

Die Hybrid-Strategie von Microsoft zielt darauf ab, die Lücke zwischen lokaler Hardware und globaler Cloud-Verwaltung zu schließen. Die Bereitstellung als Azure Arc-Erweiterung stellt sicher, dass Administratoren dieselben Governance-Tools nutzen können, während Entwickler von Kubernetes-nativen Custom Resource Definitions (CRDs) wie Model und ModelDeployment profitieren. Die Integration des Agent-Accelerators setzt zudem auf dem neuen Microsoft Agent Framework auf, was Semantic Kernel und AutoGen ablöst, und beschleunigt die Adoption von Multi-Agenten-Architekturen wie sequenziellen Pipelines oder delegierenden Orchestratoren.

Praktische Erkenntnisse

Evaluierung anfordern: Da sich Foundry Local in der Vorschau befindet, sollten Plattform-Engineers über das Microsoft-Formular Zugang anfordern.
Hybrid-Profile prüfen: Stellen Sie sicher, dass Ihre Azure Local-Hardware über die notwendigen GPU-Treiber und Kubernetes-Zertifizierungen verfügt.
Multi-Agenten-Architektur nutzen: Evaluieren Sie für komplexe Geschäftsprozesse den Einsatz spezialisierter Agenten (z. B. getrennt nach Datenbeschaffung, Analyse und Qualitätssicherung) statt eines einzigen Prompts.

Offene Fragen

Wie verhält sich die Inferenz-Performance von Foundry Local unter Volllast im Vergleich zu Azure-nativen Instanzen?
Welche Einschränkungen ergeben sich bei vollständig offline betriebenen (physisch getrennten) Systemen bezüglich der Modellsynchronisierung?

Microsoft erweitert Azure AI Foundry um lokale Bereitstellungen und Multi-Agenten-Beschleuniger

🔄 Update — 19. Juni 2026: Microsoft startet „Foundry Local“ und „Foundry Labs“

Was ist neu?

Warum es den Artikel ergänzt

Microsoft erweitert Azure AI Foundry um lokale Bereitstellungen und Multi-Agenten-Beschleuniger

Zusammenfassung

Was ist passiert?

Warum es wichtig ist

Beweise

Analyse

Praktische Erkenntnisse

Offene Fragen

Quellen