メタFAIRが分子特性予測・言語処理・神経科学を加速する新しいオープンソースAIモデルを発表
最終更新日:2025年05月19日

2025年5月14日、メタの基礎AI研究チーム(FAIR)が、分子特性予測、言語処理、神経科学の分野における新たな研究成果を発表した。
Open Molecules 2025(OMol25)データセットとUniversal Model for Atoms(UMA)モデルを中心に、原子レベルの設計を革新し、新しい分子と材料の発見を加速させる取り組みだ。これらの研究は、高度な機械知能(AMI)の達成に向けた科学的・学術的進歩の一環として、AI研究コミュニティに広く公開される。
- メタFAIRが原子レベルの分子設計を加速する新データセットOpen Molecules 2025とUMAモデルを公開
- 報酬駆動型の生成モデリングを実現する「Adjoint Sampling」アルゴリズムを開発し、分子生成における優れた性能を実証
- ロスチャイルド財団病院との共同研究で人間の脳内言語処理発達の大規模マッピングを実施し、LLMとの類似性を発見
メタFAIRの今回の研究発表の中心となるのは、Open Molecules 2025(OMol25)と名付けられた密度汎関数理論(DFT)データセットだ。このデータセットは、これまでメタが公開してきたオープンサイエンスシミュレーションデータセット群を分子化学の領域に拡張するものである。
OMol25は、生体分子、金属錯体、電解質に関する高精度量子化学計算の最大かつ最も多様なデータセットとして、ヘルスケアやエネルギー貯蔵技術における原子レベルの設計に前例のない精度をもたらす。
高性能量子化学プログラムパッケージORCA(バージョン6.0.1)を用いて構築されたOMol25には、これまで到達不可能だった大規模原子システムのシミュレーションが含まれている。従来の分子データセットは20〜30原子程度の小規模なシミュレーションに限られていたのに対し、OMol25は最大10倍の大きさの構成を持ち、様々な元素間の複雑な相互作用を含んでいる。このデータセットの構築には60億コア時間の計算リソースが投入された。
さらに、メタはUniversal Model for Atoms(UMA)という機械学習原子間ポテンシャルモデルも公開した。
このモデルは、過去5年間にメタが公開した分子と材料を含むすべてのデータセットに含まれる300億以上の原子をトレーニングに使用しており、幅広い材料や分子における原子間相互作用のモデリングで新たな基準を設定している。
UMAは、より正確な予測と分子挙動の理解を提供する基盤モデルとして、下流のユースケースや微調整アプリケーションのための多用途なベースを提供する。
また、メタFAIRはデータなしで生成モデルをトレーニングするための「Adjoint Sampling」という新しいアルゴリズムも発表した。
このアルゴリズムは、既存のデータからパターンを見つけるのではなく、提供された報酬モデルに従って自身のサンプルを反復的に改良することでパターンを発見する。
FAIRで開発された理論的基盤に基づくAdjoint Samplingは、高度にスケーラブルな実用的アルゴリズムをもたらし、報酬駆動型生成モデリングの研究の基礎となる可能性を持つ。特にUMAのような大規模エネルギーモデルからの多様な分子生成において優れた性能を示している。
さらに、メタFAIRとロスチャイルド財団病院は、神経記録を用いて脳内での言語表現の発達を体系的にマッピングする初の大規模研究を発表した。てんかんを患う40人以上の患者の7,000以上の皮質電極から得られた神経信号を分析し、子供時代を通じて脳内の言語処理がどのように進化するかについて、前例のない洞察を提供している。
この研究により、2歳という若い子供でも皮質に幅広い音声表現が見られること、そして脳の成熟に伴いこれらの神経表現がますます豊かで複雑な処理をサポートするようになることが示されている。
驚くべきことに、この発達の軌跡はwav2vec 2.0やLlama 3.1のような人工知能モデルにも自然に反映されており、それらの内部活性化はトレーニングとともに成人の脳のものと次第に類似するようになる。
AI Market の見解
メタFAIRの今回の発表は、AI研究におけるオープンサイエンスの重要性を強調している。特にOMol25データセットとUMAモデルの公開は、原子レベルの分子設計分野において大きな進展をもたらすと考えられる。
これらのツールは、新薬開発やエネルギー貯蔵技術など、社会的インパクトの大きい領域での研究を加速させる可能性が高い。また、Adjoint Samplingアルゴリズムは、データ不足の状況下でも効率的に生成モデルをトレーニングできる新しい手法として、AIの適用範囲を拡大させる重要な技術的進歩と位置づけられる。
神経科学とAIの融合研究においても、人間の言語獲得プロセスとLLMの学習過程の類似性を示す今回の知見は、より人間に近い効率的な学習方法の開発に影響を与えると予想される。メタが国立研究所や大学機関と積極的に連携している点は、産学官連携によるAI研究の推進モデルとして注目に値する。
参照元:Meta
AIオープンソース研究に関するよくある質問まとめ
- メタのOpen Molecules 2025とUMAモデルは具体的にどのような分野で活用できるのですか?
Open Molecules 2025とUMAモデルは主に、新薬開発、エネルギー貯蔵技術の改良、気候変動対策のための新材料開発といった分野で活用できる。
従来、分子や材料の設計・発見プロセスは実験的手法に頼っており、構想から大規模製造まで数十年を要することが多かった。これらのAIツールは原子レベルの挙動を高精度に予測することで、開発サイクルを大幅に短縮し、イノベーションの可能性を広げることが期待される。
- Adjoint Samplingアルゴリズムはどのような点で従来の生成モデルと異なるのですか?
Adjoint Samplingの主な特徴は、トレーニングデータがなくても報酬信号のみを用いて生成モデルをトレーニングできる点にある。
従来の生成モデルはデータからパターンを学習して類似のサンプルを生成するが、Adjoint Samplingは提供された報酬モデルに基づいて自身のサンプルを反復的に改良する。これにより、画像・動画生成モデルの微調整や、物理・化学の基礎モデルからのサンプリングなど、限られたデータしか存在しない特殊な応用分野でも効果的に機能する。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
