AIニュース・トレンド Mamba-3発表、推論特化の新LLMアーキテクチャ
Carnegie Mellon大学とPrinceton大学の研究チームが、推論に特化した新しい言語モデルアーキテクチャ「Mamba-3」を発表しました。従来のTransformerやMamba-2と比較して、推論時の計算効率が大幅に向上しています。特に注目すべきは、前世代のMamba-2の半分のメモリ使用量で同等の性能を実現している点です。現時点では研究段階ですが、将来的にAPIやツールとして提供されれば、フリーランスが使うAIサービスのコスト削減や応答速度の向上につながる可能性があります。