生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

記事一覧

生成AIの記事一覧

【Meta】Omnilingual ASRとは?LLMの技術を音声認識に応用した特徴、性能、料金、利用方法まで徹底解説!

【Meta】Omnilingual ASRとは?LLMの技術を音声認識に応用した特徴、性能、料金、利用方法まで徹底解説!

1,600以上の言語に対応し、500以上の低リソース言語に初めてAI文字起こしを実現したオープンソースASRモデル 少数の音声サンプルで新言語を追加可能なインコ...

SAM Audio とは?特徴、機能、性能、ライセンス・料金、利用方法まで徹底解説!

SAM Audio とは?特徴、機能、性能、ライセンス・料金、利用方法まで徹底解説!

Metaが2025年12月に音声分離特化の統合型AIモデル「SAM Audio」を発表 テキスト・視覚・時間指定の3種類のプロンプトで目的の音を高精度分離 環境...

Bing Image Creatorとは?できること・主な機能、使い方を実際に画像生成して徹底解説!

Bing Image Creatorとは?できること・主な機能、使い方を実際に画像生成して徹底解説!

Bing Image Creatorはテキストを入力するだけで、高品質な画像を無料かつ高速に生成でき、日常的な利用にも対応した柔軟な設計 生成結果はDALL·E...

Qwenとは?できること・機能、モデル・料金、ChatGPT・Claude・Geminiとの違い、使い方まで徹底解説!

Qwenとは?できること・機能、モデル・料金、ChatGPT・Claude・Geminiとの違い、使い方まで徹底解説!

QwenはAlibaba Cloudが提供する多機能AIサービスで搭載されているLLMも同名のQwenファミリー Qwen Chatを中心に、Deep Rese...

LLaVAとは?アーキテクチャ・特徴・マルチモーダル競合との比較を徹底解説!

LLaVAとは?アーキテクチャ・特徴・マルチモーダル競合との比較を徹底解説!

Microsoftとウィスコンシン大学マディソン校が公開したマルチモーダルAIであるLLaVA(Large Language and Vision Assist...

SAM 3Dとは?提供モデル、できること、仕組み、性能、実画面付きの使い方まで徹底解説!

SAM 3Dとは?提供モデル、できること、仕組み、性能、実画面付きの使い方まで徹底解説!

SAM 3Dは、単一の2D画像から人や物体、シーン全体を高精度に3D再構成できるMetaの研究モデル 物体向けの「SAM 3D Objects」と人体特化の「S...

Duet AIとは?概要やBardなど他AIサービスとの違いまで徹底解説!

Duet AIとは?何に使える?Geminiに統合されてこれからどうなる?

Duet AIとは、Googleが開発している生成AI(ジェネレーティブAI)のことです。主にGoogleアプリケーションに搭載され、Google Worksp...

Grokipediaとは?何ができる?特徴と主な機能・料金・Wikipediaとの違い・使い方徹底解説!

Grokipediaとは?何ができる?特徴と主な機能・料金・Wikipediaとの違い・使い方徹底解説!

GrokipediaはGrokモデルによる記事生成とファクトチェックを一体化し、公開初日に88万件超の記事を提供 読者による直接編集を制限し、提案型の編集ワーク...

Qwen3-VLとは?特徴、性能、モデルの種類とAPI料金、利用方法、実際の利用レポート、活用事例まで徹底解説!

Qwen3-VLとは?特徴、性能、モデルの種類とAPI料金、利用方法、実際の利用レポート、活用事例まで徹底解説!

Qwen3-VLはAlibabaのQwenチームが開発したマルチモーダル基盤モデルでテキスト・画像・動画の理解と生成を統合 Gemini 2.5 ProやGPT...

Qwen3とは?特徴、性能、料金プラン、利用方法、 活用事例、Qwen2.5との違いまで徹底解説!

Qwen3とは?特徴、性能、料金プラン、利用方法、 活用事例、Qwen2.5との違いまで徹底解説!

2025年4月にAlibaba Cloudが発表した「Qwen3」は、Qwenシリーズ第三世代の大規模言語モデル群 従来比で倍増した36兆トークンの学習データと...

1 2 3 4 5 43