OpenAI、リアルタイムAPI公開ベータ版をリリース。自然な音声対話アプリの開発が可能に
最終更新日:2024年10月03日
2024年10月1日(現地時間)、OpenAIは開発者向けにリアルタイムAPIの公開ベータ版をリリースした。これにより、低遅延でマルチモーダルな音声対話体験をアプリケーションに組み込むことが可能になる。
さらに、数週間以内にチャット補完APIにも音声入出力機能が追加される予定だ。この新機能により、開発者は音声アシスタントやリアルタイム翻訳など、自然な会話体験を実現するアプリケーションを単一のAPI呼び出しで構築できるようになる。
尚、リアルタイムAPIには、6つのプリセット音声が搭載される。
<本ニュースの10秒要約>
- 低遅延・マルチモーダルな音声対話体験を実現するリアルタイムAPIの公開ベータ版をリリース
- チャット補完APIに音声入出力機能を追加予定で、単一API呼び出しで自然な会話体験を構築可能に
- 音声アシスタント、言語学習、カスタマーサポートなど幅広い用途での活用が期待される新機能
リアルタイムAPIの特徴と仕組み
リアルタイムAPIは、WebSocketを使用して持続的な接続を確立し、GPT-4oとメッセージをやり取りする。このAPIは音声入力と出力を直接ストリーミングすることで、より自然な会話体験を可能にする。また、ChatGPTの高度な音声モードと同様に、会話の中断にも自動的に対応できる。
従来の音声アシスタント開発では、音声認識、テキスト推論、音声合成の3つのモデルを組み合わせる必要があった。この方法では感情や強調、アクセントが失われ、顕著な遅延が生じていた。リアルタイムAPIはこれらの問題を解決し、より自然で応答性の高い会話体験を実現する。
開発者向けの機能と価格設定
リアルタイムAPIは、function callingをサポートしており、音声アシスタントがユーザーの要求に応じてアクションを起こしたり、新しいコンテキストを取り込んだりすることが可能だ。例えば、ユーザーの代わりに注文を行ったり、関連する顧客情報を取得して応答をパーソナライズしたりできる。
価格設定については、テキスト入力トークンが100万トークンあたり5ドル、出力トークンが20ドルとなっている。音声入力は100万トークンあたり100ドル、出力は200ドルだ。これは音声入力が1分あたり約0.06ドル、出力が0.24ドルに相当する。チャット補完APIの音声機能も同じ価格設定になる予定だ。
安全性とプライバシーへの取り組み
OpenAIは、リアルタイムAPIの乱用リスクを軽減するため、複数の安全対策を講じている。これには、自動モニタリングや、フラグが立てられたモデル入力と出力の人間によるレビューが含まれる。APIはChatGPTの高度な音声モードと同じバージョンのGPT-4oを使用しており、自動評価と人間による評価の両方を経て慎重に評価されている。
また、開発者に対しては、ユーザーがAIと対話していることを明確にすることを義務付けている。OpenAIは、スパムや誤解を招く目的、あるいは他者に害を与える目的でのAPIの出力の再利用や配布を禁止しており、潜在的な乱用を積極的に監視している。
AI Market の見解
OpenAIのリアルタイムAPIベータ版のリリースは、音声AIアプリケーション開発の新時代を切り拓く画期的な進展だ。この技術により、開発者は複雑なモデルの組み合わせを行う必要がなくなり、コールセンターで活用可能なボイスボットなど、より自然で応答性の高い音声対話システムを容易に構築できるようになる。特に、低遅延性と感情や強調の保持は、ユーザーエクスペリエンスを大幅に向上させる可能性がある。
ビジネス的観点からは、この技術は顧客サービス、言語学習、アクセシビリティなど、幅広い分野で革新をもたらす可能性がある。特に、function callingのサポートにより、音声AIを既存のシステムやサービスとシームレスに統合できる点は注目に値する。
しかし、この技術の普及には課題も存在する。今後は、AIとの対話を人間との対話と区別することの重要性が増すだろう。また、音声トークンの価格設定は、一部の開発者にとっては障壁となる可能性がある。
今後、OpenAIがこの技術をさらに発展させ、より多くのモダリティやモデルをサポートすることで、AIアプリケーションの可能性はさらに広がると想定される。
参照元:OpenAI
ChatGPTの仕組みを詳しく知りたい方はこちら、また、ChatGPTの導入支援会社をお探しの方はこちらの記事もご参考ください。
AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏(旧:Twitter)やYoutubeなど、他SNSアカウントもフォローしてください!
𝕏:@AIMarket_jp
Youtube:@aimarket_channel
TikTok:@aimarket_jp
過去のニュース一覧:ニュース一覧
ニュース記事について:ニュース記事制作方針
運営会社:BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら:ai-market-press@biz-t.jp