OpenAI「GPT-5.4」発表、PC操作も可能に

何が変わったのか
1. 技術的な進化のポイント
実務でどう使えるか
1. APIでの活用方法
従来モデルとの比較
フリーランスへの影響
まとめ

何が変わったのか

GPT-5.4は、OpenAIが「専門職向けの最も能力の高いモデル」と位置づける新しいAIです。従来のGPT-5.2から約半年ぶりのメジャーアップデートで、2つのバージョンが用意されています。標準の「Thinking版」と、より複雑なタスクに対応する「Pro版」です。

最も注目すべき変化は、AIが初めてパソコンを直接操作できるようになったことです。これまでのChatGPTは、質問に答えたり文章を書いたりすることはできましたが、実際にアプリケーションを開いたり、ボタンをクリックしたりすることはできませんでした。GPT-5.4では、この壁を越えています。

例えば、こんな使い方が可能になります。「この10件の取引先情報をExcelにまとめて、売上順に並べ替えて」と指示すると、AIが自分でExcelを開き、データを入力し、並べ替えまで完了させます。あなたは結果を確認するだけです。

技術的な進化のポイント

コンテキストウィンドウが100万トークンまで拡大されました。これは、約75万語、日本語なら新書10冊分以上の文章を一度に理解できる計算です。長い契約書や膨大なリサーチ資料を丸ごと読み込ませて分析させることが現実的になりました。

エラー率も大幅に改善されています。従来のGPT-5.2と比べて、個別の事実に関する間違いが33%減少し、回答全体としては18%エラーが少なくなりました。特にフリーランスにとって重要なのは、クライアント向けの資料作成で事実誤認が減ることです。納品物の品質チェックにかかる時間が短縮できます。

コード作成能力も強化されました。GPT-5.3 Codexの精密なコーディング能力が統合され、さらに「Fast Mode」が追加されています。これにより、従来の最大1.5倍の速度でコードを生成できるようになりました。

実務でどう使えるか

まず、データ分析の作業が劇的に変わります。ChatGPT for ExcelとGoogle Sheetsのベータ版が提供開始され、複雑な財務モデルの構築や分析がAIに任せられるようになりました。例えば、複数のクライアントから受け取った請求書データを一つのスプレッドシートに統合し、月次レポートを自動作成するといった作業が可能です。

ウェブリサーチの効率も上がります。「競合他社5社のサービス内容と価格をまとめて」と指示すれば、AIが各社のウェブサイトを訪問し、情報を収集してまとめてくれます。従来は数時間かかっていた作業が、数分で完了する可能性があります。

プログラマーやノーコード開発者には、新しい「Playwright (Interactive)」機能が役立ちます。ウェブアプリやElectronアプリのデバッグを、リアルタイムでビジュアルに確認しながら進められます。コードのどこで問題が起きているかを、AIと一緒に画面を見ながら特定できるイメージです。

ライターやマーケターには、新しいChatGPT統合機能が便利です。FactSet、MSCI、Third Bridge、Moody’sといった専門データベースと連携できるようになったため、金融や企業分析の記事作成で、信頼性の高いデータを素早く引用できます。

APIでの活用方法

API経由で利用する場合、新しい「Tool Search」システムが実装されています。これは、必要な機能定義だけを検索して使用するため、トークン使用量を47%削減できる仕組みです。例えば、250の異なるタスクを実行する自動化システムを構築した場合、従来と比べて約半分のAPI利用料で済む計算になります。

APIは「gpt-5.4」(標準版)と「gpt-5.4-pro」(Pro版)の2種類で提供されています。Pro版はより複雑なタスクに対応しますが、計算リソースを多く消費するため、アクセスはProまたはEnterpriseプラン加入者に限定されています。

従来モデルとの比較

GPT-5.2からの最大の進化は、やはりコンピュータ操作能力です。OSWorld-Verifiedという、デスクトップ環境でのナビゲーション能力を測るベンチマークで、GPT-5.4は75.0%のスコアを記録しました。GPT-5.2の47.3%から大幅に向上し、人間の平均スコア72.4%を上回っています。

知識労働タスクの評価であるGDPvalでは、83%という記録的なスコアを達成しました。法律や金融といった専門分野のタスクを測定するMercor APEX-Agentsベンチマークでも、業界トップの成績です。

トークンあたりの価格はGPT-5.2より若干高くなっていますが、トークン効率が向上しているため、実際の作業にかかる総費用は低下する可能性があります。同じタスクを完了するのに必要なトークン数が減れば、単価が上がっても総額は下がるという仕組みです。

フリーランスへの影響

このアップデートで最も恩恵を受けるのは、定型作業に時間を取られているフリーランスです。データ入力、情報収集、書類作成といった、頭を使わないが時間はかかる作業を、AIに任せられる範囲が広がりました。

特に影響が大きいのは、ライター、データアナリスト、マーケター、プログラマー、財務コンサルタントといった職種です。例えば、クライアント向けの月次レポート作成に毎月5時間かけていた場合、その大部分をAIが代行できる可能性があります。浮いた時間を、より高単価な戦略立案やクリエイティブな仕事に充てられます。

ただし、すべての作業がAIに置き換わるわけではありません。最終的な品質チェック、クライアントとのコミュニケーション、戦略的な判断といった部分は、依然として人間の仕事です。GPT-5.4は「作業の助手」であり、「代替」ではないという認識が重要です。

収益面では、2つの方向性が考えられます。一つは、作業時間の短縮により同じ時間でより多くの案件をこなせるようになること。もう一つは、AIを活用した高度なサービスを提供することで、単価を上げられる可能性です。例えば、「AI活用による迅速なデータ分析」といった付加価値を打ち出すことができます。

注意すべき点もあります。GPT-5.2 Thinkingは3ヶ月後に廃止される予定です。現在このモデルをAPIで利用している場合は、早めにGPT-5.4への移行を検討する必要があります。また、思考プロセスの説明が誤った方向に進む可能性があるため、OpenAIは新しい安全評価を実施しています。重要な判断を伴う作業では、AIの出力を鵜呑みにせず、必ず人間が確認するフローを組み込むべきです。

まとめ

GPT-5.4は、AIが「質問に答える」段階から「実際に作業をする」段階へ進化したことを示すアップデートです。ChatGPT Plus加入者なら追加料金なしで今日から使えるため、まずは簡単なタスクから試してみることをお勧めします。「このExcelファイルのデータを整理して」「この3つのウェブサイトから価格情報を集めて」といった、普段5分から10分かかっている作業を任せてみてください。

API利用者は、Tool Searchによるトークン削減効果を確認する価値があります。既存の自動化システムをGPT-5.4に切り替えることで、月々のAPI利用料が大幅に下がる可能性があります。

しばらく様子見でも構いません。特に、クライアントの機密情報を扱う場合や、ミスが許されない作業の場合は、他のユーザーの使用例が蓄積されてから導入を検討するのも賢明な選択です。

参考リンク:
OpenAI launches GPT-5.4 with Pro and Thinking versions – TechCrunch