医療AIの新たな可能性を開くMaxToki
2026年4月、Gladstone研究所を中心とした国際研究チームが、細胞の老化を予測する画期的なAIモデル「MaxToki」を発表しました。このモデルは単一細胞のRNA配列データを解析し、その細胞が将来どのように変化するかを予測できます。
MaxTokiの最大の特徴は、時間軸を考慮できる点です。従来の生物学系AIモデルは、ある瞬間の細胞状態しか読み取れませんでした。しかしMaxTokiは、複数の時点での細胞状態を連続的に処理し、「この細胞は今後どう変化するか」「実年齢に対してどれだけ老化が進んでいるか」を推定できます。
技術的には、ChatGPTなどと同じトランスフォーマーアーキテクチャを採用しています。ただし処理するのは言語ではなく、細胞内の遺伝子発現データです。約1兆個の遺伝子トークンで訓練されており、パラメータ数は2億1700万と10億の2つのバージョンが用意されています。
訓練データの規模と工夫
MaxTokiの訓練は2段階で行われました。第1段階では約1億7500万の単一細胞転写体を含むGenecorpus-175Mで基礎訓練を実施。第2段階では、人間の細胞約2200万個、約600種類の細胞型、約3800人のドナーから得られたデータを使い、生まれてから90歳以上までの幅広い年齢層をカバーしています。
興味深いのは、訓練データから意図的に除外されたものがある点です。がん細胞や人工的に不老化させた細胞株は、正常な遺伝子ネットワークの学習を妨げるため対象外としました。また、特定の組織が訓練データの25%以上を占めないよう調整し、偏りを防いでいます。
実際に何ができるのか
MaxTokiには主に2つのタスクがあります。1つ目は、細胞の状態から時間経過を予測すること。例えば「この細胞は採取時から何ヶ月経過しているか」を月単位で推定できます。予測誤差の中央値は87ヶ月で、従来の線形回帰モデルの178ヶ月と比べて大幅に精度が向上しています。
2つ目は、未来の細胞状態を生成すること。「現在の細胞状態から6ヶ月後、この細胞はどうなっているか」といった予測が可能です。生成された細胞の約95%が実際の単一細胞として認識できるレベルの精度を持っています。
病気との関連で見えてきたこと
研究チームは、さまざまな疾患患者の細胞を解析しました。その結果、喫煙者の肺粘膜上皮細胞は、同年齢の非喫煙者と比べて約5年分の老化促進が見られました。肺線維症患者の肺線維芽細胞では約15年、アルツハイマー病患者のミクログリア(脳の免疫細胞)では約3年の老化促進が確認されています。
興味深いのは、軽度認知障害の患者や、アルツハイマー病の病理学的変化はあるものの認知機能が保たれている人のミクログリアでは、老化促進が見られなかった点です。これは、認知症の発症メカニズムを理解する上で重要な手がかりになる可能性があります。
さらに研究チームは、心臓細胞での老化促進因子を特定し、人工多能性幹細胞(iPSC)から作った心筋細胞や生きたマウスで検証を行いました。特定の遺伝子ネットワークの異常が、わずか6週間以内に測定可能な心機能障害を引き起こすことを確認しています。
技術的な革新ポイント
MaxTokiが優れているのは、いくつかの技術的工夫があるためです。まず「ランク値エンコーディング」という手法を採用しています。これは、遺伝子発現の絶対量ではなく、相対的な順位でデータを表現する方法です。この工夫により、測定機器や実験条件の違いによる影響を受けにくくなっています。
また、NVIDIAのBioNeMoスタックやFlashAttention-2といった最新技術を導入し、訓練速度を5倍に向上させました。推論(予測の実行)は、高性能GPU上で従来の400倍以上の速度で動作します。
モデルの注意機構を分析したところ、約半分の注意ヘッドが、特別な指示を与えなくても転写因子(遺伝子の発現を調節する重要なタンパク質)に他の遺伝子より強く注目することを学習していました。これは、モデルが生物学的に意味のあるパターンを自動的に捉えている証拠と言えます。
フリーランスへの影響
MaxTokiは基礎研究向けのツールであり、フリーランスのライターやデザイナーが直接使う機会は限定的です。ただし、バイオテクノロジーや医療分野のコンテンツ制作に携わっている方にとっては、重要なトピックになります。
特にメディカルライティングやサイエンスコミュニケーションを手がけている方は、このような最先端研究を分かりやすく伝える需要が今後増えるでしょう。製薬会社やバイオベンチャーが、MaxTokiのような技術を使った創薬プロセスを説明する資料作成を外注するケースも考えられます。
また、エディトリアルデザイナーやインフォグラフィック制作者にとっては、細胞の老化プロセスや遺伝子発現データを視覚化する仕事が生まれる可能性があります。複雑な生物学的データを一般の人にも理解できる形で表現するスキルの価値は、今後さらに高まるはずです。
プログラミングスキルを持つフリーランスエンジニアなら、公開されているモデルとコードを活用して、バイオテクノロジー企業向けのカスタムツール開発に関わることもできるでしょう。HuggingFaceでモデルが公開されているため、技術的なハードルは比較的低くなっています。
まとめ
MaxTokiは、細胞レベルでの老化プロセスを理解し予測する新しいAIツールです。フリーランスとして直接活用する機会は限られますが、医療・バイオテクノロジー分野のコンテンツ制作に携わっている方は、このような技術動向を把握しておくと良いでしょう。
研究論文とモデルは既に公開されており、興味のある方は以下のリンクから詳細を確認できます。バイオインフォマティクスの知識がある方なら、実際にモデルを試してみるのも面白いかもしれません。
参考リンク:
論文: https://www.biorxiv.org/content/10.64898/2026.03.30.715396v1.full.pdf
モデル: https://huggingface.co/theodoris-lab/MaxToki
コード: https://github.com/NVIDIA-Digital-Bio/MaxToki


コメント