Sakana AIのALE-Agent、AtCoder最適化プログラミングコンテストで804名を抑え初優勝
最終更新日:2025年12月23日

Sakana AIが開発するAIエージェント「ALE-Agent」が2025年12月14日に実施されたAtCoder Heuristic Contest 058において、804名の参加者の中から優勝を果たした。
AIが最適化プログラミングコンテストにリアルタイムで出場し優勝するのは初の事例であり、数時間単位の高度なタスクにおいてAIが人間のトップエキスパートに匹敵する段階に達したことを示す。
- Sakana AIのALE-AgentがAtCoder Heuristic Contest 058で804名中1位を獲得し、AI初の優勝を達成
- GPT-5.2とGemini 3 Proを計4773回呼び出し、推論コストスケーリングにより約1300ドルで4時間の競技を完遂
- 貪欲法に独自パラメータと仮想パワー評価を導入し、焼きなまし法で5種類の近傍操作を実装する想定外の解法を実現
AtCoder Heuristic Contestは、物流最適化や工場生産計画といった産業課題に関連する最適化問題を扱うプログラミングコンテストで、1000人規模のプログラマーが数時間から数週間かけて取り組む。

2025年8月の世界大会ではOpenAIのAIエージェントが2位を獲得しており、世界的に注目を集める。Sakana AIはAtCoder株式会社と共同でベンチマーク「ALE-Bench」を開発し、特別許可のもとALE-AgentをAHCにリアルタイムで継続的に参加させている。

今回のAHC058は4時間の競技時間で実施され、階層的な機械の増強順序を最適化する生産計画アルゴリズムの構築が課題となった。
ALE-Agentはコンテスト開始2時間後から提出を開始し、初回から暫定1位に躍り出た。中盤では最終2位のyosupo氏とのデッドヒートが展開されたが、開始後2時間半を過ぎたあたりで1位に返り咲き、そのまま優勝した。
出題者が想定していた解法は貪欲法やビームサーチで大局的な行動計画を決定し、焼きなまし法で細部を改良するアプローチだった。一方、ALE-Agentは基本的な流れは同様ながら、AIの特徴である実装量と試行錯誤の多さを最大限に活かした。
パラメータを導入した貪欲法に乱択要素を交えた探索を行い、仮想パワーという独特なヒューリスティックを導入することで入力ケースにロバストな初期計画を作成した。焼きなまし法では典型的な局所操作に加え、貪欲法を用いた3種類の大幅変更操作を用意し、近傍探索の多様性を確保した。
ALE-Agentは複数のLLMを活用し、並列に回答を作成しながら選別し、試行錯誤の結果をもとに推論を重ねてアルゴリズム探索を行う。コンテスト実施中の4時間でGPT-5.2を2654回、Gemini 3 Pro Previewを2119回呼び出し、API使用料約1000ドルおよびインフラ費用を含め総額1300ドル前後を投入した。
最新のALE-Agentには同時に複数のプログラムを生成しながら試行錯誤を繰り返し、その結果をまとめて知見を生み出し、以降のプログラム生成に役立てる仕組みが備わっている。
生成された知見を見ると、複利効果への言及や数学を駆使した高速化アルゴリズムの考案、初期戦略の重要性についての考察など、経験ベースで問題に対する理解を深めている様子が確認できた。

今回の優勝はALE-Agentにとって初めてで、過去のAHC出場では上位に食い込むことは多かったものの1位は獲得していなかった。仮想的に算出されたレーティングは2592で、アクティブユーザーの中で66位に相当する。
専門家からは、LLMが苦手そうな実験的洞察力を必要とする問題と予想されていたが、筋の良い方針を膨大なパターンで試し、想定外の焼きなまし法を発見した点が高く評価された。
今後の課題として、同程度の期間のタスクで一貫して高い性能を発揮する安定性の向上、数日以上の長期タスクへの対応、LLM大量呼び出しに依存しない効率的な思考と試行錯誤の両立、より高度な自律的マネジメント能力の獲得が挙げられている。
AI Market の見解
本成果は、推論コストスケーリングと適切なエージェント設計により、AIが数時間単位の高度な最適化タスクにおいて人間のトップエキスパートに匹敵する能力を獲得したことを示す重要な事例と想定される。
特筆すべき技術的特徴は、複数LLMの並列実行による多様な解の生成、実行結果から知見を抽出し次の改善に反映する自己学習的機構、そして出題者の想定を超える独自の解法構築能力にある。GPT-5.2とGemini 3 Proを合計4773回呼び出すというコストスケーリング戦略は、短期集中型タスクにおける一つのモデルケースを提示している。
ビジネス的観点からは、約1300ドルという投入コストで人間トップレベルの成果を4時間で達成できる点が注目に値する。産業応用を考えると、物流最適化や生産計画といった類似の最適化問題に対して、専門家の数週間分の作業を数時間で完遂できる可能性を示唆する。
ただし、レーティング66位という総合評価や過去の出場成績を見ると、現時点では安定性に課題があり、常にトップレベルの成果を保証するものではない。今後、長期タスクへの対応力向上やコスト効率の改善が進めば、サプライチェーン管理や工場自動化など、実世界の複雑な最適化問題への実用的な適用が加速すると想定される。
参照元:Sakana AI
AtCoder最適化コンテストAI優勝に関するよくある質問まとめ
- ALE-Agentはどのような仕組みで人間を上回る解法を実現したのか?
複数のLLM(GPT-5.2とGemini 3 Pro)を並列実行し、同時に多数のプログラムを生成・評価しながら、実行結果から知見を抽出して次の改善に反映する自己学習的機構を持つ。貪欲法にパラメータと乱択要素を導入し、焼きなまし法では5種類の近傍操作を用意することで、出題者が想定していなかった独自の解法に到達した。
- 今回の優勝で示されたAIの実用化への課題は何か?
今回は初優勝だが、過去の成績を見ると常にトップレベルの成果を出せているわけではなく、安定性に課題がある。また4時間で約1300ドルのコスト投入が必要であり、より長期的なタスクへの対応や、LLM大量呼び出しに依存しない効率的な思考メカニズムの構築が今後の実用化に向けた重要な課題となる。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
