
OpenAI、リアルタイムAPI機能を大幅強化した音声対話AI「gpt-realtime」を一般提供開始
OpenAIは2025年8月28日、最新の音声対話AI「gpt-realtime」とリアルタイムAPIの一般提供を開始したと発表した。 新モデルは従来比で指示理...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス
OpenAIは2025年8月28日、最新の音声対話AI「gpt-realtime」とリアルタイムAPIの一般提供を開始したと発表した。 新モデルは従来比で指示理...
Gemini 2.5 Flash Imageは、単に画像を生成するだけでなく、自然言語での指示(プロンプト)を通じて対話するように既存の画像を編集・修正 同一キ...
Googleは2025年8月26日、新しい画像生成・編集モデル「Gemini 2.5 Flash Image」(別名nano-banana)を発表した。 このモ...
システム開発の現場で、コードを書く時間やバグ修正に追われる方も多いのではないでしょうか? Meta社が2023年8月にリリースした「Code Llama」は、プ...
ChatGPTを開発・提供するOpenAIは、2025年1月23日(現地時間)にAIエージェントの「Operator」のプレビュー版を米国の一部ユーザーに提供開...
AIエージェントが企業での業務効率化の切り札として注目されていますが、開発や運用には専門知識や複雑な環境構築、そしてセキュリティの確保が不可欠です。そこでマイク...
Agnoは記憶・知識(RAG)・ツール連携機能を持つ自律的なAIエージェントをPythonで構築できるオープンソースフレームワーク 単一のエージェントだけでなく...
Anthropic APIは、ClaudeファミリーのAIモデルを活用できる公式インターフェース 用途に応じてOpus・Sonnet・Haikuなど複数モデルか...
Metaが開発したLlamaは、高性能ながら原則無料で商用利用も可能なオープンソースのLLM(大規模言語モデル) クローズドなモデル(ChatGPT等)と異なり...
Grok CLIは、xAIのGrokを活用できるサードパーティのオープンソース対話型AIコマンドラインツール 自然言語でファイル操作やコマンド実行が可能 オープ...