AIニュース・トレンド LLMが16トークン同時生成、拡散モデルで最大7.7倍速に
AIスタートアップのZyphraが2026年5月、新しい言語モデル「ZAYA1-8B-Diffusion-Preview」を公開しました。従来のAIが1トークンずつ順番に文章を生成するのに対し、このモデルは16トークンをまとめて同時に生成する仕組みを採用しています。独自のサンプリング方式では最大7.7倍の速度向上を実現しており、LLMの推論コスト削減に関心のある開発者にとって注目の研究成果です。