AI業界最新ニュース【AI Market人気記事2024年10月まとめ版】

最終更新日：2024年11月05日

AIニュース

「AIを導入したいが、具体的に何から始めればいいのか分からない」「自社のビジネスにAIをどう活用できるのか、イメージが湧かない」─こんな声をよく耳にします。確かに、日々進化するAI技術の中から、自社に最適なものを選び出すのは容易ではありません。

しかし、2024年10月の1か月の動きを見ると、企業でのAI活用の方向性が徐々に見えてきました。特に注目すべきは、既存の業務フローに自然に組み込める形でAI技術が進化している点です。

例えば、ChatGPTの新機能「Canvas」は文書作成やコーディングの現場で、Claudeの新機能は日常的なPC操作の自動化で、それぞれ実践的な価値を提供し始めています。

本記事では、2024年10月に発表された主要なAI関連ニュースを、実務での活用可能性を軸に整理しました。各企業の状況に応じた具体的な活用方法も併せて解説します。

本記事はAI Marketメルマガ会員にお送りしているメールマガジンを加筆、再構成した特別版です。AI業界の最新ニュース、人気の活用事例、事業に取り込む秘訣について簡単にアップデートできるAI Marketのメールマガジンを定期購読したい方はこちらからご登録お願いします。

1 ChatGPTの新インターフェース「Canvas」の発表
2 Anthropicが発表したClaudeの「コンピューター操作機能」
3 AnthropicによるMessage Batches APIの提供開始
4 Stable Diffusion 3.5シリーズの全面刷新 – オープンソースAI画像生成の新時代
5 GoogleがGemma 2 2Bの日本語版を発表
6 MetaがLlamaの量子化モデルを発表 – モバイルデバイス向けに最適化
7 メルマガ会員登録（無料）

ChatGPTの新インターフェース「Canvas」の発表

ChatGPTが新機能「canvas」でAIとの共同作業が劇的に向上、執筆やコーディングがより効率的に

公開日: 2024年10月4日

OpenAIが、ChatGPTの新機能「Canvas」を発表しました。これは執筆やコーディング作業に特化した新しいインターフェースで、従来のチャット形式を超えた協働作業を可能にします。

主な特徴は以下です。

別ウィンドウでの作業環境
テキストの選択的編集機能
文章の長さや読解レベルの調整
コードのデバッグや言語変換機能
インライン形式でのフィードバック提供

この発表の技術的な重要性は、GPT-4oモデルを基盤としながら、特定のタスクに最適化された学習アプローチを採用している点にあります。OpenAIは自動評価と人間評価を組み合わせた独自の学習手法を開発し、従来のプロンプトエンジニアリングから、より直感的なインターフェースエンジニアリングへと進化を遂げています。

ビジネス面では、AI導入を検討する企業にとって画期的な進展といえます。特に、技術者と非技術者の協働を促進する可能性を秘めており、プロジェクト管理ツールとしても活用できる柔軟性を備えています。MicrosoftのCopilotとの差別化も図られており、エンタープライズ市場でのAI導入を加速させる要因となるでしょう。

実務での活用シーンとして、技術文書の作成や品質管理、コードレビューの自動化などが考えられます。特に、複数の言語を扱う開発環境において、その真価を発揮すると予想されます。インライン形式でのフィードバック機能は、従来の開発フローを大きく改善する可能性があります。

今後の展望として、API連携の拡充やエンタープライズ向け機能の追加が期待されます。特に、企業独自のニーズに応じたカスタマイズ機能の実装は、ビジネス現場での採用を促進する重要な要素となるでしょう。

Anthropicが発表したClaudeの「コンピューター操作機能」

Anthropic、コンピュータ操作が可能な新機能を発表、AI Claude 3.5がマウス操作とキーボード入力で人間のようにPC操作が可能に

公開日: 2024年10月23日

AnthropicがClaude 3.5 Sonnetに新たに実装した「コンピューター操作機能」です。この機能により、Claudeは適切なソフトウェア設定の下で、カーソル移動、クリック操作、キーボード入力など、人間と同様の方法でコンピューターを操作できるようになりました。現在パブリックベータとして提供されています。

この機能の実装には、画像認識技術とツール操作の技術が組み合わされています。Claudeは画面のスクリーンショットを解析し、ピクセル単位で正確な位置を計算してカーソルを移動させます。注目すべきは、限られたソフトウェアでの学習にもかかわらず、その経験を他のソフトウェアにも応用できる汎用性を獲得した点です。

現時点でのパフォーマンスは、コンピューター操作評価指標「OSWorld」で14.9%のスコアを記録。人間の70-75%には及びませんが、他のAIモデルの7.7%を大きく上回っています。

企業にとって重要な点は、以下の3つです。

データプライバシーへの配慮：スクリーンショットデータはモデルの学習に使用されない方針を採用
安全性への取り組み：プロンプトインジェクションなどのリスクに対する対策を実施
実用面での制限：政府ウェブサイトやソーシャルメディアへの投稿など、特定の操作は制限

現状の課題として、操作速度が遅く、ドラッグやズームなどの一部の操作に対応できていない点が挙げられます。また、画面の変化を連続的に捉えられないため、短時間の通知などを見落とす可能性もあります。

この機能は、AIと既存のソフトウェアを融合させる新しいアプローチとして注目されています。特に企業のIT部門やシステム開発者にとって、業務自動化の選択肢を広げる可能性を持っています。

AnthropicによるMessage Batches APIの提供開始

Anthropic、大規模非同期処理を半額で実現。「Message Batches API」で企業のAI活用を加速

公開日: 2024年10月9日

AnthropicがMessage Batches APIのパブリックベータ版の提供を開始しました。このAPIは、大量のクエリを非同期で処理する新しいサービスです。

最大10,000件のクエリを一括で送信でき、24時間以内に処理が完了します。通常のAPI呼び出しと比べて50%のコスト削減が可能です。現在、Claude 3.5 Sonnet、Claude 3 Opus、Claude 3 Haikuに対応しています。

大規模データ処理のニーズに着目すると、顧客フィードバックの分析や言語翻訳など、リアルタイム性を必要としない処理において、このAPIは大きな価値を提供します。従来は複雑なキューイングシステムや制限管理が必要でしたが、このAPIにより運用負荷を軽減できます。

価格設定も注目点です。入力・出力トークンともに50%の割引が適用され、特にClaude 3 Haikuモデルは入力が0.125ドル/M、出力が0.625ドル/Mと、コスト効率の高い選択肢となっています。

ユースケースとして、Quoraが要約機能とハイライト抽出に活用している事例が挙げられます。Quoraの製品マネージャーは、コスト削減だけでなく、複雑な並列処理の管理から解放されたことで、エンジニアがより本質的な課題に取り組めるようになったと評価しています。

企業のIT部門にとって、このAPIは以下の観点で検討に値します：

インフラ管理の簡素化
大規模データ処理のコスト最適化
エンジニアリングリソースの効率的な配分

今後は、Google Cloud’s Vertex AIでのサポートも予定されており、クラウドサービス間の相互運用性も向上する見込みです。

Stable Diffusion 3.5シリーズの全面刷新 – オープンソースAI画像生成の新時代

Stability AI、史上最強のAI画像生成モデル「Stable Diffusion 3.5」を発表 – 商用利用可能な大規模・高速・中型の3モデルを無償提供へ

公開日: 2024年10月22日

Stability AIは、同社の主力製品であるStable Diffusionの最新版となるバージョン3.5シリーズを発表しました。Large（80億パラメータ）、Large Turbo（高速版）、Medium（26億パラメータ）の3モデルを展開し、商用利用可能なオープンソースライセンスで提供を開始。

特筆すべきは、高度なカスタマイズ性と実用的なハードウェア要件を重視した設計アプローチです。

今回のStable Diffusion 3.5の発表は、オープンソースAI画像生成分野における重要な転換点といえます。技術面では、Query-Key Normalizationの採用により、従来課題とされていたファインチューニングの難しさを大幅に改善しました。

特に注目すべきは、わずか9.9GBというVRAM要件を実現した点です。これにより、高価な専用機材を持たない中小企業や個人クリエイターでも、実用的なAI画像生成が可能となりました。

年間収益100万ドル未満の企業に対する商用利用の無償提供は、AI技術の産業応用を促進する大きな一歩です。さらに、生成物に対する完全な所有権を付与することで、企業のビジネス展開における不確実性を払拭しました。

大手企業向けのエンタープライズライセンスも用意されており、ビジネス規模に応じた柔軟な展開が可能です。

市場への影響も極めて大きいと考えられます。Midjourney、DALL･E 3などの商用サービスが台頭する中、高品質なオープンソースモデルの登場は、市場に健全な競争をもたらすでしょう。

複数のプラットフォームでの展開戦略により、技術へのアクセス性も担保されています。特に、コミュニティからのフィードバックを重視した開発姿勢は、持続的な改善と進化を予感させます。

実務での活用については、企業規模や目的に応じた多様な展開が考えられます。中小企業では社内のビジュアル制作基盤として、スタートアップ企業では独自サービスの差別化要素として、また研究開発部門では特定用途向けモデルの開発基盤として、それぞれ有効活用が期待できます。

この発表は、技術革新とビジネス応用の両面で画期的な意義を持ち、特に中小企業やスタートアップにとって、AIを活用したビジネス展開の新たな可能性を示すものといえます。オープンソースの特性を活かしつつ、商用利用も見据えた戦略的な展開は、AI技術の社会実装における新たなモデルケースとなるでしょう。

GoogleがGemma 2 2Bの日本語版を発表

Google、日本語版Gemma 2 2Bを公開！GPT-3.5を凌ぐ性能と多言語対応

公開日: 2024年10月3日

GoogleがTokyo Gemma Developer Dayにて、日本語に最適化されたLLM（大規模言語モデル）「日本語版Gemma 2 2B」を公開しました。このモデルは、オリジナルのGemma 2と比較して文章力や指示理解能力が向上し、自社評価ではGPT-3.5を上回るパフォーマンスを示しています。

この発表は、言語モデルの開発において以下の点で注目に値します。

モバイル端末での高速処理を実現
日英バイリンガル能力の両立
小規模モデルながら高性能を実現

技術面では、比較的小規模なモデルサイズながら高い性能を実現していることが注目されます。これはモバイルデバイスでの実装を視野に入れた設計であり、実用性を重視したアプローチといえます。

また、Googleは東京科学大学との産学連携を通じて研究開発を推進し、TPU Research Cloudプログラムによる研究支援も提供しています。さらに、Kaggleを活用したコミュニティ開発という手法を採用することで、モデルの継続的な改善と発展を目指しています。

市場における本モデルの重要性は、そのオープン性にあります。開発者が自由にカスタマイズできる点は、各企業や組織が独自のニーズに合わせてモデルを最適化できることを意味します。これは特に、日本企業における言語モデルの実用化を促進する可能性があります。

企業のAI活用という観点では、このモデルは運用コストの削減と開発の柔軟性という二つの利点を提供します。軽量モデルであることから、導入と運用にかかるコストを抑えることができ、さらにオープンモデルとしての特性を活かして、業務に特化した調整が可能です。

Googleのこの取り組みは、日本のAI開発コミュニティに新たな選択肢を提供するものとして評価されています。特に、言語の壁を超えたグローバルなコミュニケーションツールとしての可能性が期待されており、今後の発展が注目されています。産学連携とコミュニティ主導の開発アプローチは、日本におけるAI技術の発展に新たな方向性を示すものといえるでしょう。

MetaがLlamaの量子化モデルを発表 – モバイルデバイス向けに最適化

MetaがLlamaの量子化モデルを公開。モバイルデバイス向けに処理速度2-4倍、メモリ使用量41%削減を実現

公開日: 2024年10月24日

Metaが、モバイルデバイスでの実行に最適化された量子化版Llama 3.2モデル（1Bと3B）を発表しました。このモデルは、オリジナルと比較して2-4倍の処理速度向上、モデルサイズ56%削減、メモリ使用量41%削減を実現しています。

QLoRA（Quantization-Aware Training with LoRA adaptors）とSpinQuantという2つの量子化技術を採用し、QualcommやMediaTekのSoC上での実行をサポートしています。

この発表は、AI業界において重要な意味を持ちます。従来、LLM（大規模言語モデル）のモバイルデバイスでの実行には大きな制約がありましたが、Metaの新しいアプローチはこの課題に対する現実的な解決策を提示しています。

技術面では、量子化手法の選択が興味深いポイントです。QLoRAは精度を重視した手法で、トレーニングデータへのアクセスが可能な場合に最適です。一方、SpinQuantはトレーニングデータを必要としない後処理型の量子化手法で、より汎用的な使用が可能です。

実装面では、PyTorchのExecuTorchフレームワークを通じて提供され、特にArm CPUに最適化されています。性能評価はOnePlus 12、Samsung S24+、S22などの実際のモバイルデバイスで行われ、安定した性能向上が確認されています。

市場へのインパクトとして、このモデルの登場は特にエッジコンピューティング分野に大きな影響を与える可能性があります。プライバシーの観点からオンデバイス処理が求められる用途や、通信環境が不安定な環境での利用など、新たなユースケースの開拓が期待されます。

開発者にとって重要な点は、モデルの最適化に必要な専門知識や計算リソースの負担が軽減されることです。特にSpinQuantを使用することで、独自にファインチューニングしたモデルを容易に量子化できる点は、実用面で大きな利点となります。

今後の展望として、NPU（Neural Processing Unit）での実行に向けた開発が進められており、さらなる性能向上が期待されています。Metaのこの取り組みは、モバイルAIの実用化に向けた重要な一歩となるでしょう。

メルマガ会員登録（無料）

AI MarketではChatGPTをはじめとするLLM（大規模言語モデル）のカスタマイズ実績豊富なAI開発会社の選定・紹介を行っています。貴社に最適な会社に手間なく数日で出会えます。貴社の要望に応えることが可能な企業複数社の紹介が可能で、相見積もり・比較もすぐに実施可能。

プロのAIコンサルタントが貴社の代わりに数社選定しますので、開発会社の選定に迷ったり、相談方法がわからなかったら、累計1,000件以上の相談実績を持つAI Marketへ、いつでもお気軽にご相談ください。

【無料】LLMに強いAI開発会社選定を依頼する

ChatGPT/LLM導入・カスタマイズに強いAI開発会社を自力で選びたい方はこちらで特集していますので併せてご覧ください。

記事作成・監修者

AI Market ニュース配信チーム

AI Market ニュース配信チームでは、AI Market がピックアップするAIや生成AIに関する業務提携、新技術発表など、編集部厳選のニュースコンテンツを配信しています。AIに関する最新の情報を収集したい方は、ぜひ𝕏（旧：Twitter）やYoutubeなど、他SNSアカウントもフォローしてください！

𝕏：@AIMarket_jp
Youtube：@aimarket_channel
TikTok：@aimarket_jp
過去のニュース一覧：ニュース一覧
ニュース記事について：ニュース記事制作方針

運営会社：BizTech株式会社
ニュース掲載に関するご意見・ご相談はこちら：ai-market-press@biz-t.jp