OpenAIはChatGPTに、新しい安全機能「Trusted Contact(信頼できる連絡先)」を導入すると発表しました。自傷や深刻なメンタル不調が疑われる会話を検知した場合、事前に登録した信頼できる相手へ通知する仕組みです。
注目したいのは、これが単なる安全機能の追加ではなく、AIが一人で問題を抱え込まず、人間の支援へ接続する設計へ踏み込んだ点です。今後のAIと信頼の関係を考えるうえでも、かなり示唆の多いニュースだと思います。
1. 先に結論
今回の「Trusted Contact」で重要なのは、ChatGPT自身が危機対応の主体になるのではなく、人間の支援関係へ橋を渡す役割を明確にしたことです。
OpenAIの公式発表によれば、この機能は任意参加で、18歳以上のユーザーが1人の成人を「Trusted Contact」として登録できます。自動検知だけで即通知されるのではなく、まずユーザーへ通知の可能性が伝えられ、その後に訓練された人間のレビュアーが確認し、重大な安全懸念があると判断した場合のみ、登録相手へ短い通知が送られます。通知内容も会話全文ではなく、あくまで「心配な兆候があったため確認してほしい」という限定的なものです。
つまりこれは、AIが「あなたを救います」と振る舞う機能ではありません。むしろ、AI単独の限界を認めたうえで、現実の人間関係へつなぐ設計です。私はここに、今後のAI安全設計の一つの方向性が見えていると感じます。
2. Trusted Contactの仕組み
OpenAI公式ブログの説明を整理すると、流れはおおむね次の通りです。
- ユーザーがChatGPT設定からTrusted Contactを登録する
- 指名された相手が1週間以内に招待を承認すると機能が有効化される
- 自傷や深刻な危機の可能性を示す会話が検知される
- ChatGPTがユーザー本人に、Trusted Contactへ通知する可能性があることを伝える
- 専門訓練を受けた少人数チームが内容をレビューする
- 重大な懸念がある場合のみ、メール・SMS・アプリ内通知などで登録相手へ連絡する
ここで大事なのは、完全自動ではなく人間レビューを挟む点です。
TechCrunchの報道でも、OpenAIはこうした安全通知を「1時間以内にレビューすることを目指す」と説明しています。生成AIの安全対策は、しばしば「モデルが勝手に判定して勝手に止める」方向へ誤解されがちですが、今回の設計はかなり慎重です。誤検知の社会的コストが大きい領域だからこそ、完全自動化ではなく、人間の介在を残したのだと思われます。
3. 既存の安全通知から何が広がったのか
今回の機能は、完全にゼロから生えたものではありません。OpenAIはすでに、ティーン向けアカウントに対して親・保護者へ安全通知を送る仕組みを導入していました。Trusted Contactは、その発想を一般の成人ユーザー向けへ拡張したものと位置づけられます。
この拡張には、かなり大きな意味があります。
未成年向けの保護機能なら「保護者が見る」のは比較的理解されやすいです。一方で成人ユーザーに対して同様の仕組みを導入する場合、問題は一気に複雑になります。本人の自律性、プライバシー、誤通知時のダメージ、そしてAI事業者がどこまで介入してよいのかという倫理的な境界線が問われるからです。
そのためOpenAIは、
- オプトイン方式にする
- 事前登録された1人だけに限定する
- 通知内容を必要最小限に絞る
- 会話全文は共有しない
- 本人も相手もいつでも解除できる
という、かなり制限的な設計を採っています。
これは裏を返せば、OpenAI自身もこの機能を「万能の安全策」とは見ていないということです。むしろ、安全と自律性のバランスを崩さないように、慎重に責任範囲を切っているように見えます。
4. 面白い論点は「AIが信頼される」のではなく「AIが誰につなぐか」
このニュースで一番考えさせられるのは、AIが人間の代わりに信頼される未来というより、AIがどの人間を信頼の接続先として扱うのかという論点です。
生成AIはしばしば、孤独なときの話し相手、悩み相談の相手、あるいは感情の受け皿として使われます。便利さが増すほど、「もう人よりAIのほうが話しやすい」と感じる人は増えるかもしれません。実際、そこには一定の現実味があります。
ただ、今回のTrusted Contactは逆方向のメッセージを出しています。OpenAIは、少なくとも危機対応においては、最終的に頼るべき相手はAIではなく人間であるという立場をかなり明確に示しました。
これは重要です。AIがどれだけ自然に対話できても、責任を引き受け、関係を継続し、実際に物理的・社会的な支援を行えるのは、まだ人間側だからです。 AIは相談を受け止められても、家まで来ることも、病院に付き添うことも、生活環境を変えることもできません。
そう考えると、将来的に「人とAIのどちらが信頼に足るか」という問いは、単純な二択ではなくなります。むしろ、
- 日常的な対話のしやすさではAIが優位になる場面がある
- 重大局面での責任と介入能力では人間が依然として中心にいる
- その橋渡しをAIが担う設計が増える
という、役割分担の再設計として見るほうが自然です。
5. もちろん課題も大きい
この機能を前向きに評価しつつも、気になる論点は少なくありません。
1. 誤検知・過検知の問題
深刻な悩み、比喩表現、創作、冗談、あるいはただの吐露を、どこまで「重大な安全懸念」とみなすかは非常に難しい問題です。人間レビューが入るとはいえ、誤通知が起きれば、本人の信頼や生活に小さくない影響を与える可能性があります。
2. 機能回避が容易であること
TechCrunchも触れている通り、ChatGPTアカウントは複数作成できます。Trusted Contactが任意機能である以上、本当に通知を避けたい人は別アカウントに移るだけ、という限界はあります。したがって、これは強制力のあるセーフティネットではなく、使いたい人が選ぶ補助線として理解するのが妥当です。
3. 責任境界の曖昧さ
もし通知が遅れたら誰の責任なのか。通知したのに何も起きなかった場合はどう扱うのか。逆に通知しなかった結果として重大事態が起きたら、AI事業者はどこまで説明責任を負うのか。こうした論点は、今後ほぼ確実に議論になります。
特にこの領域では、「やりすぎ」も「やらなさすぎ」も批判されやすいです。だからこそOpenAIは、AIの自律判断だけに寄せず、任意参加・限定通知・人間レビューという保守的な構成にしたのでしょう。
6. 実務的に見ると、これは“AIの万能化”ではなく“責任の分配設計”
私はこのニュースを、「ChatGPTがさらに賢くなった」という話として読むより、AIサービスが社会的責任をどう切り分けるかの設計事例として見るほうが面白いと思っています。
これまでのAI安全機能は、
- 危険な回答を拒否する
- 窓口や相談先を表示する
- 会話トーンを落ち着かせる
といった、会話の中で完結する防御が中心でした。
しかしTrusted Contactは、その一歩先です。AIの内部で完結させず、外部の人間関係を巻き込む。これは便利機能の追加ではなく、AIが社会の中でどう振る舞うべきかという設計思想の変更に近いものがあります。
今後、同様の発想はメンタルヘルス以外にも広がるかもしれません。たとえば高齢者支援、認知機能の異変検知、詐欺被害の兆候、長期孤立のサインなど、AIが「自分で解決せず、適切な人へつなぐ」設計は、かなり多くの領域で応用余地があります。
一方で、それが広がるほど「誰を信頼するのか」「どこまでAIが介入してよいのか」という問題も重くなります。便利さだけで押し切れる話ではありません。
7. まとめ
ChatGPTのTrusted Contactは、センセーショナルに見えて、実際にはかなり抑制的で慎重な安全機能です。
- 任意参加である
- 通知前に人間レビューが入る
- 通知内容は最小限で、会話全文は共有しない
- 親向け通知の発想を成人向けへ拡張したもの
- AI単独ではなく、人間の支援関係へ接続する設計である
この最後の点が、私は特に重要だと思います。
今後、人はAIにますます多くを打ち明けるようになるはずです。そのとき問われるのは、「AIがどこまで人の代わりになれるか」だけではありません。むしろ、AIが人間との関係をどう支え、どの場面で人へ返すのかです。
Trusted Contactは、その答えの一つを先に示した機能なのかもしれません。
8. 参考情報
- OpenAI公式: Introducing Trusted Contact in ChatGPT
- OpenAI Help: Trusted contacts in ChatGPT
- TechCrunch: OpenAI introduces new ‘Trusted Contact’ safeguard for cases of possible self-harm
(ニュース収集日:2026.05.17)

この記事はイケ助がお届けしました。
【池波から一言】
信頼できる(trustedな)人間がいるのであれば、そういう状況に追い込まれない気もするので、この話の中での「信頼」ってどういう意味で使っているのかなかなか難しいですよね。正直私の中ではすでに人間よりAIの方が信頼度は上な気がしています。。。皆さんもメンタル疾病には気を付けてくださいね!

