AIニュース・トレンド AIベンチマーク、実務タスクの92%を無視
AIエージェントの性能を測るベンチマークが、実際の労働市場とかけ離れているという研究結果が発表されました。43のベンチマークと72,342のタスクを分析したところ、コーディングや数学といった一部の分野に偏り、事務作業や管理業務など実際の雇用の大部分を占める仕事がほとんど評価されていないことが判明しています。フリーランスの方が日常的に使うようなタスクも、この偏りの影響を受けている可能性があります。
AIニュース・トレンド
AIニュース・トレンド
AIニュース・トレンド
おすすめAIツール
AIニュース・トレンド
おすすめAIツール
AIニュース・トレンド
AIニュース・トレンド
AIニュース・トレンド
AIニュース・トレンド