Microsoft erweitert Azure AI Foundry um lokale Bereitstellungen und Multi-Agenten-Beschleuniger
🔄 Update — 19. Juni 2026: Microsoft startet „Foundry Local“ und „Foundry Labs“
Microsoft erweitert die lokale Agenten-Ausführung durch die offizielle Vorschau von „Foundry Local“ auf Azure Local, wodurch Inferenz und Multi-Agenten-Workflows vollständig on-device und ohne Cloud-Abhängigkeiten laufen. Zeitgleich startet „Foundry Labs“ als neues Portal für experimentelle, interaktive KI-Szenarien, wie etwa Code-Reasoning auf Repository-Ebene.
Was ist neu?
- Foundry Local: Unterstützung für lokale Modellinferenz und Multi-Agenten-Systeme direkt auf Azure Local-Hardware, um vollständige Datenhoheit im On-Premises-Betrieb zu gewährleisten.
- Foundry Labs: Ein öffentliches Portal zur Demonstration komplexer, experimenteller KI-Workflows, darunter Code-Verständnis im großen Maßstab und biologische Strukturvorhersagen.
Warum es den Artikel ergänzt
Diese Erweiterungen untermauern die These des Artikels, dass Microsofts Hybrid-Strategie den Übergang von Cloud-Only-Diensten zu vollständig kontrollierbaren, hybriden Multi-Agenten-Architekturen maßgeblich vorantreibt.
Microsoft erweitert Azure AI Foundry um lokale Bereitstellungen und Multi-Agenten-Beschleuniger
Zusammenfassung
Microsoft baut die Präsenz von Azure AI Foundry (ehemals Azure AI Studio) im Hybrid- und Enterprise-Bereich erheblich aus. Mit der Ankündigung von „Foundry Local auf Azure Local“ können Unternehmen Arc-fähige Kubernetes-Cluster nutzen, um KI-Modelle vollständig lokal auszuführen. Dies sichert Datenhoheit und ermöglicht Inferenz mit minimaler Latenz. Parallel dazu stellt Microsoft den „Azure AI Agent Accelerator“ bereit – ein Entwickler-Template, das die Orchestrierung komplexer Multi-Agenten-Systeme vereinfacht.
Was ist passiert?
- Foundry Local auf Azure Local: Microsoft hat ein neues lokales Deployment-Modell als Azure Arc-Erweiterung in der Vorschau (Preview) veröffentlicht. Damit lassen sich KI-Modelle auf lokaler Infrastruktur unter Kubernetes-nativem Betrieb (CPU und GPU) ausführen.
- Multi-Agenten-Beschleuniger: Eine neue Community-Initiative und Video-Tutorials dokumentieren die Entwicklung kollaborativer Agenten-Netzwerke mithilfe des Azure AI Agent Accelerator.
- Sicherheits- und Zugriffssteuerungen: Lokale Endpunkte werden über API-Schlüssel, TLS und Microsoft Entra ID abgesichert, um Enterprise-Sicherheitsanforderungen in hybriden und physisch getrennten Netzwerken zu erfüllen.
- Katalogsynchronisierung: Die Plattform synchronisiert Modellmetadaten aus dem globalen Azure AI Foundry-Katalog, um Konsistenz bei der Modellauswahl zu gewährleisten.
Warum es wichtig ist
Im Enterprise-Bereich stehen Datenschutz, Governance und Latenz oft im Konflikt mit rein Cloud-basierten KI-Diensten. „Foundry Local auf Azure Local“ löst dieses Dilemma, indem es das Cloud-Entwicklungsmodell auf On-Premises-Infrastrukturen bringt. Gleichzeitig zeigt die Einführung des Agent-Accelerators, dass sich die Branche von monolithischen Chat-Assistenten hin zu dezentralen, spezialisierten Agenten-Teams entwickelt, die komplexe Geschäftsprozesse autonom bearbeiten.
Beweise
- Offizielle Dokumentation: Die offizielle Microsoft Learn-Dokumentation beschreibt die Architektur und Voraussetzungen für Foundry Local.
- Entwickler-Discussions: GitHub-Diskussionen im Repository von Microsoft Foundry zeigen eine starke Nachfrage nach lokalen Deployments für Student- und Custom-Modelle im Vergleich zu teuren Cloud-Instanzen.
- Video-Ressourcen: Ein detailliertes YouTube-Tutorial führt Entwickler durch das Aufsetzen von Multi-Agenten-Systemen.
Analyse
Die Hybrid-Strategie von Microsoft zielt darauf ab, die Lücke zwischen lokaler Hardware und globaler Cloud-Verwaltung zu schließen. Die Bereitstellung als Azure Arc-Erweiterung stellt sicher, dass Administratoren dieselben Governance-Tools nutzen können, während Entwickler von Kubernetes-nativen Custom Resource Definitions (CRDs) wie Model und ModelDeployment profitieren. Die Integration des Agent-Accelerators setzt zudem auf dem neuen Microsoft Agent Framework auf, was Semantic Kernel und AutoGen ablöst, und beschleunigt die Adoption von Multi-Agenten-Architekturen wie sequenziellen Pipelines oder delegierenden Orchestratoren.
Praktische Erkenntnisse
- Evaluierung anfordern: Da sich Foundry Local in der Vorschau befindet, sollten Plattform-Engineers über das Microsoft-Formular Zugang anfordern.
- Hybrid-Profile prüfen: Stellen Sie sicher, dass Ihre Azure Local-Hardware über die notwendigen GPU-Treiber und Kubernetes-Zertifizierungen verfügt.
- Multi-Agenten-Architektur nutzen: Evaluieren Sie für komplexe Geschäftsprozesse den Einsatz spezialisierter Agenten (z. B. getrennt nach Datenbeschaffung, Analyse und Qualitätssicherung) statt eines einzigen Prompts.
Offene Fragen
- Wie verhält sich die Inferenz-Performance von Foundry Local unter Volllast im Vergleich zu Azure-nativen Instanzen?
- Welche Einschränkungen ergeben sich bei vollständig offline betriebenen (physisch getrennten) Systemen bezüglich der Modellsynchronisierung?