OpenAI / ChatGPT / Codex / リリースノート / 2026/06/04 / 重要

OpenAI API、Responses API と Chat Completions にモデレーションスコアを追加

AIapiセキュリティ

公式リリースノート

公式リリースノート: OpenAI API changelog

OpenAI は API changelog の 2026年6月4日更新で、Responses API と Chat Completions API にモデレーション scores を追加したことを案内しました。生成AIアプリケーションで安全性判定や監査ログを扱うチームにとって、モデル応答の評価情報を実装に組み込みやすくする更新です。

要点

Responses API と Chat Completions API にモデレーション scores が追加された
応答の安全性評価をアプリケーション側の制御、ログ、レビューに使いやすくなる
既存のモデレーション API や独自フィルタとの役割分担を確認する必要がある
スコアをそのまま自動判定に使うのではなく、しきい値、例外処理、監査手順を設計したい

今回のリリースノートで語られていること

モデレーション scores は、生成AIアプリケーションの安全性運用に関わる更新です。Responses API と Chat Completions API の利用時に、応答ややり取りに関するモデレーション情報を取得しやすくなることで、アプリケーション側での判定、ログ保存、後続処理の分岐、レビュー対象の抽出に使える余地が広がります。

重要なのは、これは単にスコア項目が増えたという話ではない点です。企業や公開サービスで生成AIを使う場合、不適切な出力、機密情報、ハラスメント、自己危害、違法行為支援などへの対応は、プロンプトやモデル選択だけでは完結しません。実際の入出力に対して、どのようなスコアが返り、どのしきい値でブロック・警告・人手レビュー・ログ記録を行うかを設計する必要があります。

また、Responses API と Chat Completions API の両方に関係するため、移行途中のチームにも影響があります。旧来の Chat Completions ベースの実装と、Responses API へ移行した新実装が並んでいる場合、モデレーション scores の取得方法やログ形式を揃えないと、運用上の比較や監査が難しくなります。

実務で確認したいポイント

まず、現在の安全性判定がどこで行われているかを整理してください。OpenAI のモデレーション API、独自分類器、ルールベースフィルタ、管理画面の人手レビュー、ログ監査などが混在している場合、モデレーション scores をどの層で使うのかを決める必要があります。

次に、スコアの保存範囲と利用目的を明確にします。安全性ログは有用ですが、ユーザー入力や生成結果を扱うため、保存期間、アクセス権、個人情報、社内監査、インシデント対応の手順とセットで設計する必要があります。しきい値の調整も、一度決めて終わりではなく、誤検知・見逃しのレビューを通じて継続的に見直すべきです。

結局、この更新をどう見るべきか

2026年6月4日の API changelog は、OpenAI API を使うアプリケーションに安全性判定の材料を組み込みやすくする更新です。公開サービスや社内業務ツールで生成AIを使っているチームは、モデレーション scores をログ、しきい値、レビュー運用にどう接続するかを確認したいところです。