xAI、最先端言語モデル「Grok-2」ベータ版をリリース
最終更新日:2024年09月12日
2024年8月13日(現地時間)、xAIがGrok-2およびGrok-2 miniのベータ版をリリースした。これらは同社の最新言語モデルで、チャット、コーディング、推論において飛躍的な能力向上を実現している。
特筆すべきは、LMSYSリーダーボードでGrok-2が「sus-column-r」の名で参加し、Claude 3.5 SonnetやGPT-4-Turboを上回る成績を収めたことだ。xAIはこの革新的なAIを𝕏(旧Twitter)プラットフォームのユーザーに提供し、さらに今月中に企業向けAPIも公開予定である。
<本ニュースの10秒要約>
- xAIが新言語モデルGrok-2とGrok-2 miniをベータリリース、𝕏ユーザーに提供開始
- Grok-2はLMSYSリーダーボードでClaude 3.5 SonnetとGPT-4-Turboを上回る性能を示す
- 学術ベンチマークで優れた成績を収め、視覚関連タスクでも最先端の性能を発揮
関連記事:「Grokとは?Xで利用できるLLMの使い方・料金・特徴・活用例を徹底解説!」
Grok-2の卓越した性能と評価方法
Grok-2は、LMSYSチャットボットアリーナで「sus-column-r」という名前で参加し、Claude 3.5 SonnetやGPT-4-Turboを上回る総合Eloスコアを獲得した。xAI社内でも同様の評価プロセスを採用しており、AIチューターがGrokとの対話を通じて、指示に従う能力や正確で事実に基づいた情報提供能力を評価した。
Grok-2は特に、検索内容の推論や、ツールの使用能力において大幅な改善を示し、これには、不足情報の特定、イベントの順序の推論、無関係な投稿の破棄などが含まれる。
学術ベンチマークにおける優れた成績
Grok-2とGrok-2 miniは、推論、読解力、数学、科学、コーディングなど多岐にわたる学術ベンチマークで評価された。両モデルとも、前身のGrok-1.5から大幅な性能向上を達成し、大学院レベルの科学知識(GPQA)、一般知識(MMLU、MMLU-Pro)、数学競技問題(MATH)などの分野で他の最先端モデルと競争力のあるパフォーマンスを示したとのこと。
特にGrok-2は視覚ベースのタスクで秀でており、視覚的数学推論(MathVista)や文書ベースの質問応答(DocVQA)で最先端の性能を発揮し、これらの結果は、Grok-2が幅広い分野で高い能力を持つことを示している。
𝕏プラットフォームでのGrok-2体験
xAIは𝕏プラットフォーム上でGrokの継続的な改善を行っており、今回の発表では新しいインターフェースと機能を備えた次世代のGrok体験を導入した。𝕏のプレミアムおよびプレミアム+ユーザーは、Grok-2とGrok-2 miniの2つの新モデルにアクセスできる。
Grok-2は、テキストと視覚の理解において高度な能力を持つ最先端のAIアシスタントで、プラットフォームからリアルタイムの情報を統合し、𝕏アプリのGrokタブからアクセス可能だ。一方、Grok-2 miniは、速度と回答品質のバランスを取った小型モデルとなっている。これらの新モデルは、前身と比較してより直感的で、制御しやすく、幅広いタスクに対応できる汎用性を持つ。
今後の展望と開発方針
xAIは、Grok-2とGrok-2 miniの𝕏プラットフォームへの展開を進めている。これらのモデルを活用し、検索機能の強化、𝕏投稿に関するより深い洞察、改善された返信機能など、さまざまなAI駆動機能の開発を計画している。
近い将来、𝕏上のGrok体験の中核として、マルチモーダル理解のプレビューをリリースする予定だ。xAIは、2023年11月のGrok-1発表以来、高度な人材を集めた小規模チームによって急速な進歩を遂げてきた。今後は新しい計算クラスターを活用し、コアとなる推論能力の向上に焦点を当てる方針だ。
参照元:xAI
生成AI(ジェネレーティブAI)について詳しく知りたい方はこちらの記事もご参考ください。
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp