
【Meta】Omnilingual ASRとは?特徴、性能、料金プラン、利用方法まで徹底解説!
1,600以上の言語に対応し、500以上の低リソース言語に初めてAI文字起こしを実現したオープンソース大規模ASRモデル 少数の音声サンプルで新言語を追加可能な...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

1,600以上の言語に対応し、500以上の低リソース言語に初めてAI文字起こしを実現したオープンソース大規模ASRモデル 少数の音声サンプルで新言語を追加可能な...

GPT-5.1は「Instant」「Thinking」を中心としたGPT-5の改良版で、知能と会話スタイルの両方が強化されたモデル群 Instantはより温かく...

Qwen3-VLはAlibabaのQwenチームが開発したマルチモーダル基盤モデルで、テキスト・画像・動画の理解と生成を統合し、Gemini 2.5 ProやG...

18言語対応の多言語リアルタイム通訳モデルで、音声と映像を統合解析し文脈精度を向上 入力から出力まで3秒以内の低遅延を実現、意味単位予測技術で非リアルタイム翻訳...

ブラウザ上で動作するAIがWebページを直接操作(クリック・入力・フォーム送信)し、カレンダー予約、Gmail返信下書き、条件検索やデータ抽出などを自然言語だけ...

ノーコードで業務用AIエージェントを構築でき、非エンジニアでも実用的なボットを短時間で作成可能。 Microsoft 365やTeams、Salesforceな...

OpenAIは2025年11月12日、GPT-5シリーズのアップグレード版となるGPT-5.1をリリースした。 GPT-5.1 InstantとGPT-5.1 ...

Azure OpenAI in Foundry Modelsは、Azure AI Foundry内でOpenAIモデルを統合的に管理・運用できる機能 Azure...

Googleは2025年9月25日、ロボットが物理世界で複雑な多段階タスクを実行できるAIモデル「Gemini Robotics 1.5」ファミリーを発表した。...

東芝は2025年11月、大規模プラントの数千点のセンサーから得られる時系列データから、現在の運転状態に類似する過去のデータを世界トップレベルの精度で検出する「類...