Azure AI / Azure OpenAI / 公式ブログ / 2026/05/29 / 重要
Microsoft Foundry agents向けAI observability starter kit、agent運用の可視化を解説
公式ブログ原文
Microsoft Foundry Blog は 2026年5月29日、Microsoft Foundry agents の observability starter kit を紹介しました。Agent は model response だけでなく、tool call、retrieval、外部 API、MCP server、承認フロー、retry をまたぐため、通常のアプリ監視とは違う観点が必要になります。
要点
- Foundry agents を本番運用するには、応答結果だけでなく実行過程の trace が必要になる
- tool call、retrieval、latency、failure category、cost attribution を分けて見る必要がある
- Agent の失敗は、モデル、ツール、検索、権限、入力、外部 API のどこで起きたかを切り分ける必要がある
- Observability は品質改善だけでなく、監査、セキュリティ、SLA、コスト管理にも関係する
今回のブログ記事で語られていること
この記事は、Foundry agents を「作る」段階から「運用する」段階へ進めるための内容です。Agent は、ユーザーの自然言語入力を受け、必要な情報を検索し、ツールを呼び、複数ステップで判断することがあります。そのため、最終回答だけをログに残しても、なぜ失敗したのか、どこが遅いのか、どの tool がコストを押し上げているのかは分かりません。
Observability の第一歩は trace です。ひとつの agent 実行に対して、どの prompt が使われ、どの retrieval が走り、どの tool が呼ばれ、どの応答が返り、どこで retry や fallback が発生したかを追える必要があります。これにより、モデルの回答が悪いのか、検索結果が不足しているのか、tool API が失敗しているのかを切り分けられます。
Latency の分解も重要です。Agent の遅さは、LLM だけでなく、検索、外部 API、認証、MCP server、ネットワーク、待機中の human approval によって発生します。ユーザー体験を改善するには、全体時間だけでなく、どのステップが何秒かかっているかを見る必要があります。
Cost attribution も本番運用では欠かせません。どの agent、どの workflow、どの顧客、どの tool が token usage や外部 API 使用量を増やしているかを把握できないと、利用拡大時に予算管理が難しくなります。特に複数部署で agent を共有する場合は、責任分界と quota 設計が必要です。
実務で確認したいポイント
まず、agent 実行単位の trace ID を設計してください。ユーザー操作、model call、tool call、retrieval、外部 API、ログ、コストを同じ単位で追えるようにすると、障害調査がかなり楽になります。
次に、失敗分類を決めます。Model refusal、tool timeout、permission denied、retrieval miss、schema validation failure、human approval missing などを分けておくと、改善担当が明確になります。
結局、このブログ記事をどう読むべきか
Foundry agents の observability は、便利な dashboard ではなく本番運用の前提です。Agent が業務システムに触れるほど、trace、latency、failure、cost、audit をまとめて見られる設計が必要になります。