
【Meta】Omnilingual ASRとは?特徴、性能、料金プラン、利用方法まで徹底解説!
1,600以上の言語に対応し、500以上の低リソース言語に初めてAI文字起こしを実現したオープンソース大規模ASRモデル 少数の音声サンプルで新言語を追加可能な...
生成AI、画像認識、AI開発企業等のAI会社マッチング支援サービス

1,600以上の言語に対応し、500以上の低リソース言語に初めてAI文字起こしを実現したオープンソース大規模ASRモデル 少数の音声サンプルで新言語を追加可能な...

Ray-Banのデザイン性とMetaのAI技術を融合し、ファッション性と実用性を兼ね備えた次世代スマートグラス 第2世代では3K Ultra HDカメラ・最大8...

プログラミングの世界は日々進化しており、より効率的で生産的な開発手法が求められています。そんな中で注目を集めているのが、生成AIを用いてプログラミングの世界に革...

2024年9月25日(現地時間)、MetaのCEOマーク・ザッカーバーグは、カリフォルニア州メンロパークの本社で開催された開発者向けイベントにおいて、同社の最新...

Gen1から大幅進化したセンサー性能とオンデバイス処理能力によるAI研究基盤の構築 74グラムの軽量設計と8サイズ展開による研究現場での実用性向上 複数機関での...

V-JEPA 2は、映像の見た目(ピクセル)の予測ではなく、物理法則という世界のルールを抽象的に学習 膨大な動画から自律的に学習し、ロボットの行動データを学ぶ二...

Meta社は2025年6月11日、動画から物理世界を理解・予測する世界モデル「V-JEPA 2」を発表した。 12億パラメータのこのモデルは、未知の環境と物体に...

Movie Genはテキストだけで最大16秒・1080pの動画と最大45秒の音声を一貫生成し、既存映像の編集や人物写真からの動画化にも対応 人間評価でRunwa...

Amazon Bedrockという名前は聞いたことがあっても、「Amazon Bedrockで何ができる?」「どんなモデルが使える?」など、できることや自社への...

Llama 4は、マルチモーダル対応と超長文処理性能を備え、幅広い業務を強力に支援。 Mixture of Expertsアーキテクチャ採用で、高精度かつ低コス...