OpenAI / ChatGPT / Codex / リリースノート / 2026/06/04 / 重要
OpenAI API、Responses APIとChat Completionsにmoderation scoresを追加
公式リリースノート
OpenAI は API changelog の 2026年6月4日更新で、Responses API と Chat Completions API に moderation scores を追加したことを案内しました。生成AIアプリケーションで安全性判定や監査ログを扱うチームにとって、モデル応答の評価情報を実装に組み込みやすくする更新です。
要点
- Responses API と Chat Completions API に moderation scores が追加された
- 応答の安全性評価をアプリケーション側の制御、ログ、レビューに使いやすくなる
- 既存の moderation API や独自フィルタとの役割分担を確認する必要がある
- スコアをそのまま自動判定に使うのではなく、しきい値、例外処理、監査手順を設計したい
今回のリリースノートで語られていること
moderation scores は、生成AIアプリケーションの安全性運用に関わる更新です。Responses API と Chat Completions API の利用時に、応答ややり取りに関する moderation 情報を取得しやすくなることで、アプリケーション側での判定、ログ保存、後続処理の分岐、レビュー対象の抽出に使える余地が広がります。
重要なのは、これは単にスコア項目が増えたという話ではない点です。企業や公開サービスで生成AIを使う場合、不適切な出力、機密情報、ハラスメント、自己危害、違法行為支援などへの対応は、プロンプトやモデル選択だけでは完結しません。実際の入出力に対して、どのようなスコアが返り、どのしきい値でブロック・警告・人手レビュー・ログ記録を行うかを設計する必要があります。
また、Responses API と Chat Completions API の両方に関係するため、移行途中のチームにも影響があります。旧来の Chat Completions ベースの実装と、Responses API へ移行した新実装が並んでいる場合、moderation scores の取得方法やログ形式を揃えないと、運用上の比較や監査が難しくなります。
実務で確認したいポイント
まず、現在の安全性判定がどこで行われているかを整理してください。OpenAI の moderation API、独自分類器、ルールベースフィルタ、管理画面の人手レビュー、ログ監査などが混在している場合、moderation scores をどの層で使うのかを決める必要があります。
次に、スコアの保存範囲と利用目的を明確にします。安全性ログは有用ですが、ユーザー入力や生成結果を扱うため、保存期間、アクセス権、個人情報、社内監査、インシデント対応の手順とセットで設計する必要があります。しきい値の調整も、一度決めて終わりではなく、誤検知・見逃しのレビューを通じて継続的に見直すべきです。
結局、この更新をどう見るべきか
2026年6月4日の API changelog は、OpenAI API を使うアプリケーションに安全性判定の材料を組み込みやすくする更新です。公開サービスや社内業務ツールで生成AIを使っているチームは、moderation scores をログ、しきい値、レビュー運用にどう接続するかを確認したいところです。