chihayado_ai

AIニュース・トレンド

OpenAI、AIコーディング評価基準の廃止を提案

OpenAIが業界標準だったSWE-bench Verifiedというベンチマークの引退を提案しました。理由は、評価基準の6割近くに欠陥があり、正しいコードを不合格にしてしまうケースがあるため。さらに、テスト内容がAIの学習データに含まれており、本当の実力ではなく暗記したコードを吐き出しているだけという問題も浮上しています。フリーランスのエンジニアにとっては、AIコーディングツールの性能比較が今後変わってくる可能性があります。
AIニュース・トレンド

ByteDance、AI推論の構造を分子化学で解明

ByteDanceのAI研究チームが、AIの長文推論プロセスを分子構造に例えた新しい分析手法を発表しました。この研究は、AIが複雑な問題を考える際の内部構造を化学の結合理論で説明し、学習の安定性を高める方法を提案しています。現時点では研究段階ですが、将来的にAIツールの性能向上につながる可能性があります。フリーランスがすぐに使えるツールではありませんが、今後のAI進化の方向性を知る上で興味深い内容です。
AIニュース・トレンド

ByteDanceの動画AI、著作権侵害でDisneyが猛反発

ByteDanceが開発したAI動画生成ツール「Seedance 2.0」が、ハリウッドの映画会社から著作権侵害で強い批判を受けています。特にDisneyは、自社キャラクターが無断で学習データに使われたとして使用停止を要求。ハリウッドの業界団体MPAも「著作権を無視した侵害マシン」と痛烈に非難しました。性能は高く評価されているものの、法的リスクが大きすぎるため、フリーランスのクリエイターは慎重な対応が必要です。
AIニュース・トレンド

TechCrunch Disrupt 2026、割引チケットは2月27日まで

スタートアップやテック業界の祭典「TechCrunch Disrupt 2026」が、2026年10月13日から15日までサンフランシスコで開催されます。現在、Super Early Bird料金が適用中で、個別パスなら最大680ドル、コミュニティパスなら最大30%オフで購入できます。この割引は2月27日の23:59(太平洋時間)まで。フリーランスでAI関連の仕事をしている方や、テック業界のトレンドをいち早くキャッチしたい方には見逃せないイベントです。
AIニュース・トレンド

AI写真検索の限界が判明、個人アルバムで迷子に

AIが個人の写真コレクションから特定の1枚を探すのが苦手な理由が明らかになりました。新しいベンチマーク「DeepImageSearch」のテストで、Claude Opus 4.5やGemini 3 Proなど最新モデルでも正解率は30%以下。問題は、AIが画像を1枚ずつ孤立して評価するため、「去年の夏、友達と行ったあのコンサートで青いライトが光ってた写真」のような文脈を含む検索に対応できないことです。
AIニュース・トレンド

NVIDIA DreamDojo公開、動画から学ぶロボット訓練ツール

NVIDIAが2026年2月、ロボット開発者向けの新しいツール「DreamDojo」を無料公開しました。これは44,000時間以上の人間視点の動画から物理法則を学習させた世界モデルで、実際のロボットを動かさなくてもシミュレーション環境で訓練できるというものです。従来は実機での試行錯誤に時間とコストがかかりましたが、このツールを使えば安全かつ高速に動作テストが可能になります。ロボット開発に関わるエンジニアやAI研究者にとって、開発期間の大幅短縮が期待できそうです。
AIニュース・トレンド

ChatGPTの音声機能、虚偽情報を拡散するリスクが判明

NewsGuardの最新調査で、ChatGPTとGeminiの音声機能が虚偽情報を広めやすいことが明らかになりました。健康や政治に関する誤った情報を、自然な音声で読み上げてしまうケースが確認されています。特にフリーランスでコンテンツ制作に音声AIを活用している方は、この問題を知っておく必要があります。一方でAmazonのAlexa+は全ての虚偽情報を拒否しており、音声AI選びの新たな判断基準になりそうです。
AIニュース・トレンド

Google新研究、AI推論コスト半減で精度向上

Googleが2026年2月21日、Deep-Thinking Ratioという新しいAI研究を発表しました。これはLLMの精度を高めながら、推論にかかるコストを半分に削減できる技術です。特に複雑な計算や論理的思考が必要な作業で威力を発揮し、数学オリンピックの金メダルレベルの問題を解けるほど進化しています。現在はGoogle AI Ultraのサブスクライバー向けに提供が始まっており、APIの早期アクセスも開始されています。
AIニュース・トレンド

Apple Intelligenceに人種・性別バイアス、自動要約が偏見を拡散

非営利団体AI ForensicsがApple Intelligenceの通知要約機能に深刻なバイアスがあると発表しました。iPhoneやMacで自動的に生成される要約文が、人種や性別についてステレオタイプな表現を勝手に追加していることが判明したのです。看護師を女性、外科医を男性と決めつけるなど、曖昧な文章から67%の確率で偏見に基づいた内容を「幻覚」していました。数億台のデバイスに影響する可能性があり、EU AI法の規制対象になるかもしれません。
AIニュース・トレンド

AIエージェント、ソフトウェア開発以外ではほぼ未使用

Anthropicが数百万件の実際の利用データを分析したところ、AIエージェントの利用は現在ソフトウェア開発に極端に集中していることがわかりました。全体の約50%がコーディング関連で、顧客対応や営業、財務といった他の業務ではほとんど使われていません。Claude Codeの自律作業時間は3ヶ月で2倍に伸びましたが、エージェント技術の普及はまだ初期段階にあります。
タイトルとURLをコピーしました