AIニュース・トレンド AI評価の新基準「HAIC」、実務での使いやすさを測る時代へ
MITテクノロジーレビューが、AI評価の新しい考え方「HAICベンチマーク」を紹介しました。これまでのAI評価は、チェスや数学といった単独タスクでの正確性が中心でしたが、実際の仕事では複数人でAIを使いながら進めることがほとんどです。新しい評価方法では、チーム内での長期的な使い勝手や、実際の業務フローの中でどれだけ役立つかを測ります。フリーランスがAIツールを選ぶ際の判断基準も、今後大きく変わるかもしれません。