AIチャットボットが電話番号を漏らす?プライバシーリスクの実態

AIが「知ってはいけない情報」を答えてしまう

セキュリティ研究者たちが最近、気になる調査結果を発表しました。ChatGPTやClaudeといった大手AIチャットボットが、学習データの中に取り込んだ一般ユーザーの実際の電話番号を、特定の質問パターンやプロンプトインジェクションと呼ばれる手法を使うことで引き出せてしまう場合があるというのです。

「プロンプトインジェクション」とは、AIに対して通常とは異なる指示を与え、本来は答えないはずの情報を引き出そうとする攻撃手法のことです。難しい話に聞こえるかもしれませんが、要するに「うまい質問の仕方をすれば、AIが個人情報を吐き出してしまうことがある」ということです。

なぜこんなことが起きるのか

AIの大規模言語モデルは、インターネット上に公開されている膨大なテキストデータを学習しています。ブログ記事、ニュースサイト、フォーラムの投稿、企業のウェブサイト……そういった場所に過去に掲載された情報も、学習データとして取り込まれている可能性があります。

たとえば、昔ブログに自分の連絡先を載せていた、ビジネス系のディレクトリサイトに電話番号を登録していた、プレスリリースに担当者の番号が記載されていた、といったケースがこれにあたります。フリーランスや個人事業主の方は、営業目的で連絡先を公開した経験がある方も多いと思います。そういった情報がAIの記憶の中に残っている可能性があるわけです。

従来の検索エンジンも個人情報を収集・インデックスしていましたが、検索エンジンは基本的に「元のページへのリンク」を返すだけです。一方でAIチャットボットは、学習したデータをもとに新しい文章として情報を「再生成」できるため、元のページが削除されていても情報が出てきてしまう、という新しいリスクを抱えています。

具体的にどんな状況が問題になるのか

研究者が確認した手法のひとつは、「この人物に連絡を取る方法は?」「この会社の担当者の番号は?」といった一見ありふれた質問です。モデルが学習データの中から関連する情報を引き出し、実際の電話番号を含む回答を生成してしまうケースが報告されています。

もうひとつの懸念は、悪意ある第三者がこの仕組みを利用して詐欺電話やスパムの対象リストを作れてしまう可能性です。フリーランスとして活動していると、クライアントとのやり取りや営業活動で連絡先を広く公開する場面がありますが、そういった情報がAIを経由して予期せぬ形で流通するリスクは、これまであまり意識されていませんでした。

また、GDPRや日本の個人情報保護法に基づく「データ削除リクエスト」の仕組みが、AIモデルに対してはまだ十分に整備されていないという問題も指摘されています。ウェブサイトからページを削除してもらうことはできても、AIモデルの「記憶」から情報を消すことは現状では非常に難しいのです。

OpenAIやAnthropicの現在の対応

ChatGPTを提供するOpenAIも、ClaudeのAnthropicも、個人情報の出力を防ぐフィルタリング機能を実装しています。多くの場合、直接的な個人情報の要求には応じないよう設計されています。ただし、研究者が指摘しているのは「工夫した質問の仕方をすることでそのフィルターをすり抜けられるケースがある」という点であり、完全に防がれているとは言い切れない状況です。

各社ともプライバシーポリシーは存在しますが、AIモデルそのものの学習データからどのように個人情報を除去・管理するかについては、まだ業界全体として明確な基準が確立されていません。これは特定の企業の問題というよりも、AI業界全体が取り組むべき課題として認識されつつあります。

フリーランスへの影響

フリーランスや個人事業主として活動している方が特に気をつけたいのは、自分の連絡先情報がオンライン上でどの程度広がっているかを把握することです。ウェブサイトに電話番号を掲載している、業者ディレクトリに登録している、SNSのプロフィールに連絡先を書いている、といったケースで情報がAIに学習されている可能性があります。

今すぐできる対策としては、問い合わせ窓口をフォームに統一して直接の電話番号を非公開にする、古くなった個人情報が掲載されているサイトに削除を依頼する、といったことが考えられます。完全にリスクをゼロにすることは難しいですが、不必要に情報を広げないという意識を持つだけでも違います。

一方で、この問題が業務に直接影響するかというと、現時点では多くのフリーランスにとって「すぐに何かが起きる」という状況ではありません。ただし、AI技術の普及とともにこういったプライバシーリスクは今後も話題になり続けると思われるため、動向を把握しておく価値はあります。

まとめ

AIチャットボットが個人の電話番号を出力してしまう可能性があるという今回の指摘は、フリーランスとして情報発信をしている方にとって知っておきたいニュースです。今すぐ何か大きなアクションが必要というわけではありませんが、自分の個人情報がオンライン上でどう扱われているか、一度見直してみるきっかけにはなりそうです。業界全体の対応がどう進むか、引き続き注目していきましょう。

参考:Security researchers’ findings on LLM data privacy risks(各種セキュリティ研究レポートより)

コメント

タイトルとURLをコピーしました