Azure AI / Azure OpenAI / 公式ブログ / 2026/05/29 / 重要

Microsoft Foundry agents向けAI observability starter kit、agent運用の可視化を解説

公式ブログ原文

公式ブログ原文: AI Observability Starter Kit for Microsoft Foundry agents

Microsoft Foundry Blog は 2026年5月29日、Microsoft Foundry エージェントのオブザーバビリティ starter kit を紹介しました。エージェントはモデル response だけでなく、tool call、検索、外部 API、MCP server、承認フロー、再実行をまたぐため、通常のアプリ監視とは違う観点が必要になります。

要点

Foundry エージェントを本番運用するには、応答結果だけでなく実行過程の trace が必要になる
tool call、検索、遅延、failure category、コスト attribution を分けて見る必要がある
エージェントの失敗は、モデル、ツール、検索、権限、入力、外部 API のどこで起きたかを切り分ける必要がある
オブザーバビリティは品質改善だけでなく、監査、セキュリティ、SLA、コスト管理にも関係する

今回のブログ記事で語られていること

この記事は、Foundry エージェントを「作る」段階から「運用する」段階へ進めるための内容です。エージェントは、ユーザーの自然言語入力を受け、必要な情報を検索し、ツールを呼び、複数ステップで判断することがあります。そのため、最終回答だけをログに残しても、なぜ失敗したのか、どこが遅いのか、どの tool がコストを押し上げているのかは分かりません。

オブザーバビリティの第一歩は trace です。ひとつのエージェント実行に対して、どのプロンプトが使われ、どの検索が走り、どの tool が呼ばれ、どの応答が返り、どこで再実行や fallback が発生したかを追える必要があります。これにより、モデルの回答が悪いのか、検索結果が不足しているのか、tool API が失敗しているのかを切り分けられます。

遅延の分解も重要です。エージェントの遅さは、LLM だけでなく、検索、外部 API、認証、MCP server、ネットワーク、待機中の human approval によって発生します。ユーザー体験を改善するには、全体時間だけでなく、どのステップが何秒かかっているかを見る必要があります。

コスト attribution も本番運用では欠かせません。どのエージェント、どのワークフロー、どの顧客、どの tool がトークン usage や外部 API 使用量を増やしているかを把握できないと、利用拡大時に予算管理が難しくなります。特に複数部署でエージェントを共有する場合は、責任分界とクォータ設計が必要です。

実務で確認したいポイント

まず、エージェント実行単位の trace ID を設計してください。ユーザー操作、モデル call、tool call、検索、外部 API、ログ、コストを同じ単位で追えるようにすると、障害調査がかなり楽になります。

次に、失敗分類を決めます。モデル refusal、tool timeout、権限 denied、検索 miss、スキーマ validation failure、human approval missing などを分けておくと、改善担当が明確になります。

結局、このブログ記事をどう読むべきか

Foundry エージェントのオブザーバビリティは、便利なダッシュボードではなく本番運用の前提です。エージェントが業務システムに触れるほど、trace、遅延、failure、コスト、audit をまとめて見られる設計が必要になります。