Azure AI / Azure OpenAI / 公式ブログ / 2026/05/29 / 重要
Azure Language in Foundry Tools、PII検出・リダクションのGA/Preview更新を公開
公式ブログ原文
Microsoft Foundry Blog は 2026年5月29日、Azure Language in Foundry Tools の更新として、PII 検出・リダクション、Conversational PII、Text Analytics for Health、Foundry playground に関する変更を紹介しました。メール、通話録音、会議 transcript、医療文書など、機微情報を含むテキストを AI アプリケーションで扱うチームに関係する内容です。
要点
- Text PII API の 2026-05-01 版が GA として案内された
syntheticReplacement、confidence threshold、entity type validation の制御など、リダクション運用の柔軟性が増えた- Text PII と Conversational PII には preview 更新があり、対応 entity と会話 transcript 向け処理が広がった
- Foundry 上の playground で、Text PII、Conversational PII、Text Analytics for Health を試しやすくなった
今回のブログ記事で語られていること
今回の更新は、Azure Language を単なる NLP API としてではなく、Foundry 上で AI アプリケーションや agent の入力データを安全に扱うための部品として位置づけるものです。公式記事では、日々のアプリケーションがメール、会話ログ、文書、医療関連テキストに含まれる個人情報を大量に扱うことを前提に、PII 検出と保護を自動化する必要性が示されています。
Text PII API の GA 更新では、検出した個人情報をどう置き換えるか、どの confidence 以上を出力対象にするか、entity type validation をどこまで厳密に使うかを調整できます。特に synthetic replacement は、単に伏せ字にするだけでなく、テストや downstream 処理に使いやすい形で値を置き換えたいケースに向きます。一方で、生成された置換値を本番データと混同しないよう、監査ログやデータ分類の設計も必要です。
Conversational PII の preview は、通話 transcript や会議ログのような、話者交代、言いよどみ、途中で切れる発話を含むデータを扱う点が重要です。問い合わせ窓口、医療相談、営業会話、社内 meeting recap では、通常の文書とは違う形で個人情報が現れます。会話型データを agent や検索基盤に渡す前に、どの段階で検出・リダクションするかを決めておく必要があります。
Foundry playground の追加は、導入前評価のしやすさにつながります。API を組み込む前に、代表的な文書や transcript を入れて検出精度、過剰リダクション、漏れ、出力形式を確認できます。セキュリティや法務のレビューが必要な領域では、playground で初期評価を行い、その結果をもとに本番 API の設定を決める進め方が現実的です。
実務で確認したいポイント
まず、PII 検出をどの入力面に入れるかを整理してください。ユーザー入力、通話 transcript、RAG 用の文書 ingestion、agent tool の応答、ログ保存前の加工では、求められる精度と遅延が異なります。
次に、リダクション結果を downstream に渡したときの影響を確認します。検索、要約、分類、医療テキスト解析では、値を伏せることで有用性が下がることがあります。守るべき情報と残すべき文脈を分けて、評価データで確認するのが安全です。
結局、この更新をどう見るべきか
Azure Language in Foundry Tools の更新は、AI アプリケーションの入力データ保護を Foundry の開発体験に近づけるものです。生成AIの品質だけでなく、個人情報を含むデータをどこで検出し、どこで加工し、どこまで保存するかを設計するチームにとって重要な更新です。