さくらインターネット、生成AI向け推論API基盤「さくらのAI Engine」の一般提供を開始
最終更新日:2025年09月26日

さくらインターネットが生成AI向け推論API基盤「さくらのAI Engine」を2025年9月24日より一般提供開始した。
企業や自治体が大規模言語モデルやRAG機能をAPI経由で手軽にアプリケーションに組み込むことが可能となり、国内データセンターで運営される安全性の高いインフラ上で基盤モデルを選択できる。
- さくらインターネットが推論API基盤「さくらのAI Engine」を一般提供開始し、複数の基盤モデルをAPI経由で利用可能
- 国内データセンターで完結する安全なインフラ環境により、機密情報や個人情報の取り扱いが可能
- 無償プランと従量課金プランの2種類を用意し、RAG機能やベクトルデータベース連携も提供
さくらインターネットは、生成AIを実業務やサービスで利用する推論需要の高まりを受け、企業や地方自治体が自社サービスに会話生成や音声認識機能を最小限の開発作業で実装できる推論向けAPI基盤の開発に着手した。
本サービスは生成AI向けクラウドサービス「高火力」を基盤として構築され、APIを通じて国内外の複数の基盤モデルやRAG機能を提供する。これにより企業は目的や性能要件に応じて最適な基盤モデルを選択でき、生成AIを活用したアプリケーションを自社サービスに組み込むことが可能となった。
サービスの特長として、インフラ構築が不要でクラウド上の実行環境を利用でき、各種AI機能はREST APIとして提供されるためアプリケーションへの組み込みやプロトタイプ開発が容易である点が挙げられる。
また、ベクトルデータベースと連携するRAG機能をAPI経由で簡単に利用でき、自社データを活用したチャットボットやFAQシステムの構築にも対応している。推論処理にはNVIDIA製の高性能GPUリソースを採用しており、複雑な生成AI処理に対しても安定したパフォーマンスを実現している。
提供される基盤モデルには、Chat completions機能でgpt-oss-120b、llm-jp-3.1-8x13b-instruct4、Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct-FP8が含まれ、Audio TranscriptionではWhisper-large-v3-turbo、Embeddingsではmultilingual-e5-largeが利用可能である。
料金体系は「基盤モデル無償プラン」と「従量課金プラン」の2種類が用意され、両プラン共通の無償利用枠として、Chat completionsが月3,000回、Audio transcriptionが50回、Embeddingsが10,000回設定されている。
本サービスの提供開始にあわせて、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」の名称を生成AI向けビジネス基盤「さくらのAI」へと変更した。
同社は今後「さくらのAI」のもと、生成AIを活用した各種サービスを段階的に拡充し、企業の業務効率化や事業成長を継続的に支援していく方針である。特に公共分野や高いセキュリティ要件が求められる業種においても、国内完結のインフラ環境により安心して導入できる体制を整えている。
AI Marketの見解
さくらインターネットの「さくらのAI Engine」は、国内企業の生成AI活用における重要な選択肢となると想定される。特に注目すべきは国内データセンターでの完結型サービス提供により、データ主権やプライバシー保護を重視する日本企業のニーズに応える点である。
技術的には複数の基盤モデルを統一APIで提供することで、企業の用途別最適化を可能にし、開発者の学習コストを削減している。ビジネス面では無償枠付きの料金体系により導入障壁を下げつつ、従量課金制で段階的なスケールアップを支援する設計となっている。
市場への影響としては、海外クラウド事業者が主導する生成AIインフラ市場において、日本企業による競合選択肢の提示により価格競争とサービス品質向上が期待される。また、地方自治体や中小企業における生成AI活用の加速要因となり、国内AI市場の裾野拡大に寄与すると想定される。
参照元:さくらインターネット株式会社
さくらのAI Engineに関するよくある質問まとめ
- 無償プランと従量課金プランの主な違いは何ですか?
両プランとも共通の無償利用枠がありますが、超過時の対応が異なります。
無償プランでは超過するとレート制御がかかり利用が制限される一方、従量課金プランでは超過分に対して料金が発生しますが制限なく利用できます。無償プランには申し込み数の上限があるため、継続利用を予定する場合は従量課金プランの検討が推奨されます。
- 国内完結のメリットは具体的に何ですか?
さくらインターネットが運営する国内データセンター上で基盤モデルが動作するため、機密情報や個人情報が日本国外に送信されることがありません。
これにより、公共機関や金融業界など高いセキュリティ要件が求められる業種でも、データガバナンス要件を満たしながら生成AI技術を活用できます。

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp
