GoogleのAIが「Google」を正しく綴れない理由

「Google」の中にPはいくつある?AIが答えられない理由

2026年5月27日、TechCrunchがGoogleのAI検索機能「AI Overview」に関する興味深い記事を公開しました。内容は、GoogleのAIが「Google」という単語の中に「p」が何個あるかを正確に答えられない、というものです。自分の会社名ですら正確に扱えないとなると、思わず「えっ?」と感じる方も多いのではないでしょうか。

同記事では、「poop」という単語に「r」が何個含まれているか、あるいは「journalism」のスペルを正確に示せるか、といった質問にも誤りが見られたことが報告されています。一見すると単純な質問ばかりですが、こうした「文字を数える」「綴りを確認する」といった作業が、最新AIにとって意外と難しいのです。

なぜAIは文字を数えられないのか

その理由は、LLMの処理の仕組みに深く関係しています。人間が文章を読むとき、私たちは「G・o・o・g・l・e」というように一文字ずつ認識しています。ところがLLMは、文字列をそのままの形では処理しません。「トークン化」と呼ばれる手法によって、単語や単語の一部をひとかたまりの数値として変換し、その数値のパターンをもとに次の言葉を予測します。

たとえば「Google」という単語は、LLMの内部では「Goo」と「gle」のように複数のトークンに分割されて処理されることがあります。こうなると、「この単語に『g』は何個あるか?」という質問に答えるには、一度バラバラになった情報を文字レベルで再構成しなければならず、それが正確にできないケースが生まれてしまうのです。

これは「LLMはすごく賢い」というイメージと少しギャップがあるかもしれません。高度な推論、複雑なコードの生成、長文の要約などは得意としながら、「この単語に同じ文字が何個あるか数えてください」という問いにつまずくことがある。この非対称性が、今回の話題の核心です。

Googleはどう対応しているか

この問題に対し、Googleは「文字数カウントに関する課題はLLMにとって既知の問題であり、改善に取り組んでいる」とコメントしています。つまり、Googleも認識している課題ではあるものの、すぐに根本から解決できるものではないことも暗に示しています。

なぜすぐに直せないのか、というと、トークン化はLLMの性能を支える根幹の仕組みだからです。これを大きく変えると、言語処理全体の精度に影響が出る可能性があります。改善は継続的に行われているものの、完全な解消には時間がかかるとみられています。

フリーランスへの影響:AIを信頼しすぎないためのヒント

「自分はスペルチェックにAIを使っていないし、関係ない話かな」と思うかもしれません。ただ、フリーランスとしてAIを日常的に使っている方には、今回の件はひとつのよい気づきになると思います。

たとえばAIを使ってライティングやコピーの校正をしている場合、固有名詞や専門用語の綴りをそのままAIに任せていると、誤りが混入するリスクがあります。英語のクライアントワークや、英語コンテンツのSEO対策をしているフリーランサーにとっては、特に注意が必要な点です。「AIが出力した文章だから正しいはず」という思い込みが、思わぬミスにつながることがあります。

また、AIに「この文章の中に『a』という文字は何回出てきますか?」のように文字数を数えさせる使い方も、精度が低い場合があります。文字数や綴りの確認は、最終的に人間の目でチェックする習慣をつけておくと安心です。

今回の件は、GoogleのAIに限った話ではありません。ChatGPTやClaudeなど、現在主流のLLMはいずれも同様のトークン化の仕組みを採用しているため、程度の差はあれ、文字レベルの処理に弱い面があります。高度なタスクは積極的にAIに任せながら、単純な文字確認作業は自分でも確かめる、というバランス感覚が、AIと上手く付き合うコツのひとつかもしれません。

まとめ

今回の話題は、新しいツールやアップデートではなく「AIの限界を理解する」という観点からの情報です。すぐに何か行動が必要というわけではありませんが、AIの出力を校正なしにそのまま使っている方は、一度スペルや文字数の確認フローを見直してみるのがよいかもしれません。元記事はTechCrunchでご覧いただけます。

参考:TechCrunch – Why Google’s AI can’t spell Google, or anything else

コメント

タイトルとURLをコピーしました