AI学習用のデータ収集代行会社プロ厳選おすすめ8社!【2024年最新版】
最終更新日:2024年09月23日
データ収集代行会社は、企業の要望に合わせて、自社のリソースやシステムを最大限活用して、アノテーション用データの収集代行サービスを提供している会社です。
AIを学習させる上では多くの教師データを作成することが必要です。そして、教師データを作成するためには、元となるデータの収集+アノテーション作業が必要となります。
データ収集代行会社は、自社では集めきれない膨大なデータの収集もサポートしてくれますので、「無料のデータセットが使えない!」「アノテーション用データが足りない!」、という場合は、ぜひ活用を検討して頂きたいサービスです。
ただし、いざデータ収集を行える会社にアノテーション用データの収集を依頼しようとすると、実際に提供する会社も多く、WEBサイトを見ても特徴の違いがいまいちわからない、調べることに時間がかかってしまう、といった課題を感じていませんか?
そこで今回は、AI Marketのプロのコンサルタントが1社1社のWEBサイトを調査し、またインタビュー等を通しておすすめのAI学習用データ収集会社を厳選しました。
この記事では、各社の特徴を紹介していますので、ぜひご参考ください。
また、AI Marketでは
目次
アノテーションに必要な元データとは?
AI学習用のアノテーションデータ(教師データ)を作成するためには、画像や動画、テキスト、音声など、学習の元となる多くの元データが必要です。
OCR開発を行うための手書き文字の収集やレシート画像の収集、音声認識を行うための会話データの収集、画像認識のための歩道の画像や様々な看板の画像、動画認識を行うための人の行動を収録した動画、自然言語解析AIのための様々な文章など、必要なデータの種類や数は多岐に渡ります。
世の中には、無料で使えるデータセットやクローリングで取得できるデータも多くありますが、商用利用が制限されていたり、利用規約で制限されていたり、そもそも実際に開発したいAIモデルで本当に求めるデータセットではないなどの問題も多く、実際に構築したいAIモデルに合わせて自社で必要なデータを集め、アノテーションを行う必要があるケースがほとんどです。
また、いざアノテーションを行おうとしたら、その元となるデータを保有しておらず、そのデータの収集から始めなければいけない、という課題に直面するケースも多くあります。
そこで活躍してくれるのが、AI学習用データの収集を行ってくれるデータ収集代行会社です。今回紹介するデータ収集代行会社は、元データの収集からアノテーション作業まで一貫して行ってくれる会社もありますので、ぜひご依頼ください。
AI学習用データ収集会社選定のポイント
学習用のデータ収集量が膨大、データ収集の適切な進め方がわからない、といった理由で自社でデータ収集を行うことが難しいという場合は、外部の専門業者に相談することをおすすめします。
日本には、学習用データ収集が可能なサービスが多くあります。ここではAI学習用データ収集に強い会社を選定する際のポイントを紹介しますので、ぜひ参考にしてください。
料金・費用の比較
学習用データ収集の料金・費用は会社によって異なります。自社の予算に見合った会社に依頼することが一番ですが、安さだけに注目してしまうと、低品質な仕上がりになってしまう可能性があります。
近年、アウトソーシングの発展により料金の幅に大きな差が出ているのも現状。どの程度まで品質を求めるのかを予め決定し、予算範囲内で依頼するのが重要です。納期や仕様などの作業要件を伝え、相談して料金を見積もってもらいましょう。
柔軟性があるか
こちら側の要望に柔軟に対応してくれる会社かどうかも選定のポイントです。画像であれば天気や季節など特定条件下での撮影、映像であれば見切れや背景への注意、音声であればノイズがない状態など、さまざまな要望に対応してくれる会社を選ぶことをおすすめします。
また、不備があった場合や納品後のサポートがあるかなど、納品完了後、どこまで対応してくれるのかも確認しましょう。
品質へのこだわり
教師データとなる学習用の元データは、その品質が非常に重要です。特定条件を想定したAIモデル構築用の画像データであれば、例えば撮影角度や撮影の高さなど、細かな点への配慮も必要となりますし、OCR用の手書き文字を収集したいのであれば、その網羅性やバリエーションなどが必要となるでしょう。
データ収集サービスを提供する会社であっても、AIモデルやアノテーションへの理解がまったくなければ、品質の低いものが上がってくる可能性があります。これまでの実績や事例などを確認するほか、実際に問い合わせてみましょう。
お気軽に相談ください
選び方がわかって、実際に各社のWEBサイトを見ても、どのようなコスト感なのか、どのようなサービスを提供しているのかなどがわからないケースも多いと思います。
AI Marketでは、専門のコンサルタントが各社へのヒアリング等を通して、最適なAI学習用データ収集会社を紹介することが可能です。いつでもお気軽にご相談ください。
おすすめのAI学習用データ収集会社
データ収集が可能な企業は多くありますが、その中でも今回は、データ収集も行ってくれるアノテーション会社や、学習用データ収集サービスなどを提供している会社など、AIモデルへの理解がある企業を選定しています。
Datatang株式会社
Datatang株式会社は、中国発の企業で日本国内におけるサービス展開は2020年2月に開始しました。東京都千代田区に日本支社を構えています。
世界トップクラスを誇るAI向け学習データサービスプロバイダーとして、高品質のデータ提供を行っています。データリソース・技術力・豊富なデータ処理経験を活用し、全世界のおよそ1,000社ものAI企業や研究機関への提供実績があります。
データ収集においては、オリジナルのデータ収集サービスを提供するだけでなく、学習用のデータセットを膨大に保有しており、顔識別・物体検出、スマートドライブ、自動翻訳・OCR、音声など多岐に渡る種類のデータを提供可能です。
例えば、グローバル化が進む中、多言語対応のAI音声認識・識別の応用は特に重要になってきていますが、同社は、多言語対応のAI音声認識モデル構築のためのさまざまな国の音声学習用データなども多数保有しています。スマートスピーカーの普及に伴って、音声識別の精度を高めるためにさまざまなニーズに応じたデータの必要性も高まり、子どもの声のデータ、車内騒音のデータなどのデータセットも提供可能です。
自動翻訳によく使われるコーパスデータは、多言語でのデータを大量に保有しており、OCR画像や手書きデータがあります。AI-OCRや翻訳サイト・アプリに適用可能です。
他にも、ドライブ中の運転手の映像データや、様々な角度から撮影された人物画像など、画像認識・映像認識用データも多く保有しています。
データ処理拠点やクラウドソーシングなどから外部調達してデータ収集を行っており、拠点は世界中に45カ国にのぼります。
AI Marketおすすめポイント
・多言語の音声データやコーパスデータなどの大規模データを提供可能
・世界トップクラスで品質が高い学習データのサービスプロバイダー
・カスタマイズによるデータ収集が可能
Datatang株式会社の概要
住所 | 〒101-0063 東京都千代田区神田淡路町2-105 ワテラスアネックス6階 |
設立 | 2020年2月 |
事業内容 | AI学習データ提供事業(自社データ・カスタマイズデータ) AI学習データの収集、アノテーション、プラットフォーム提供事業 |
AI Marketでは
株式会社コネクティル
株式会社コネクティルは、2014年設立の東京都千代田区に本社を構える企業です。
ビジョンには「人とITの可能性を追求する。」を定め、IT・女性活躍推進・テレワークの3つの柱の事業としています。働き方・女性とITとの融合に可能性を追い求め、組み合わせることで新たな価値を社会に提供することを目指しています。
3つの柱を組み合わせたサービスとして、結婚や出産などで退職した女性を中心として構成されたメンバーによるデータ作成・アノテーションサービスがあります。課題にフィットしたデータを集め、AIに特化したデータ作成やアノテーションサービスを手掛けています。
具体的には、画像データ、写真の収集、動画データの収集、会話音声の収集、会話テキストの収集、会話スクリプトの作成、テキストデータの収集、手書きデータの収集などさまざまなデータ作成が可能です。
退職した女性の豊富な人材と彼女たちの持つスキルを活かして、高品質なデータ提供を可能としています。作業や契約もフレキシブルに対応でき、小ロットから大ロットまで幅広い作業量に対応しています。豊富な人材を抱えているので、突発的な作業でも対応可能です。
AI Marketおすすめポイント
・ITと女性活躍推進を組み合わせた新たな価値を社会に提供
・スキルや実績を持つ、出産や介護などで退職した女性が活躍
・作業や契約もフレキシブルに対応可能
株式会社コネクティルの概要
住所 | 〒101-0032 東京都千代田区岩本町2-2-4 PMO神田岩本町Ⅱ 3F |
設立 | 2014年1月 |
事業内容 | IT事業 女性活躍推進事業 テレワーク事業 |
AI Marketでは
株式会社APTO
株式会社APTOは、2020年に設立され、東京都渋谷区に本社があり、AI開発プラットフォームやコンサルティングを手掛けています。「自走する」「技術とビジネスの両軸で考える」「ユーザーを第一に考える」の3つのバリューを大切にして事業展開をしています。
アノテーションツール、ノーコードAI・AI、AIビジネスの可視化ツールを主に開発しています。
データ収集においては、大量の高品質なデータを安価で集められるサービスとして、アノテーションなどの作業をクラウドワーカーに実施してもらうプラットフォームを構築し、専用のスマートフォンアプリ「harBest」を開発しました。
データ収集から作成・整理までをこのスマホアプリを使うことで、面倒な作業を代行して実施可能です。手間のかかるデータ収集を依頼するだけで、全国各地にいるクラウドワーカーがデータ収集を代わりに行ってくれます。そのため、作業をする専任担当者を雇う必要がな苦なり、一般的な作業料金の相場に比べ圧倒的な低価格が実現可能です。
時間に関係なく、いつでも発注でき、発注した瞬間から作業が開始されます。
画像解析に利用する画像データや、会話解析に利用する音声データなどさまざまなデータ収集が可能です。特別な条件がある場合や、品質に特にこだわりたい時は、一定基準の要件を満たした認定ワーカーだけに依頼するということもできます。
AI Marketおすすめポイント
・データ収集からアノテーションまで実施可能なスマホ向けプラットフォームの開発
・全国にいるクラウドワーカーが目的のデータ収集の作業に対応可能
・特別な条件や品質を担保するために認定ワーカーのみに依頼可能
株式会社APTOの概要
住所 | 〒150-0041 東京都渋谷区神南1-5-14 三船ビル4F 403号室 |
設立 | 2020年1月 |
事業内容 | AI開発プラットフォーム提供事業 AIコンサルティング事業 等 |
AI Marketでは
株式会社ユニメディア
株式会社ユニメディアは、本社を東京都千代田区に構える企業です。設立は2001年で、デジタルイノベーションを主に手掛けています。
「成果報酬型オープンイノベーションカンパニー」をビジョンに、広告・マーケティング、クラウドソーシング、メディア開発、ふるさと納税促進などのさまざまな事業展開をしています。
アノテーションサービスの「ANNOTEQ」ではマイクロタスク型のクラウドソーシングを活用しています。実働100万人を超えるクラウドソーシング作業者を抱えています。BPO事業者としてこれまで培ってきた品質ノウハウ管理を活用して高品質なサービス提供を行っています。
データ収集も手掛けており、画像・動画・手書き文字に対応しています。
画像・動画は、Webに掲載されている画像の収集だけでなく、スマートフォンでの撮影を基本とした実際の画像収集まで実施可能です。実際の写真撮影は、クラウドソーシング作業者だけでなく、複数のリソースを活用した写真素材収集も行っています。例として、本の表紙/背表紙、公道の写真、駐車場、車、レシート、洗剤等の商品などの依頼実績があります。
手書き文字は、実際にヒトが書く手書きの文字を収集可能です。
作業に応じて、専任作業者とクラウドワーカーとの工程分解を適切に行い、高精度高品質での作業を可能としています。
AI Marketおすすめポイント
・クラウドソーシングを活用した大規模データ収集が可能
・クラウドワーカーによる全国の撮影代行が可能
・BPO品質での納品を実施
株式会社ユニメディアの概要
住所 | 〒100-0011 東京都千代田区内幸町2-2-3 日比谷国際ビル6F |
設立 | 2001年4月 |
事業内容 | 広告・マーケティング事業 メディア開発事業 ふるさと納税促進事業 クラウドソーシング事業 新規事業・ビジネスイノベーション |
AI Marketでは
株式会社サイバーテック
株式会社サイバーテックは、1998年設立の企業で本社は東京都渋谷区に構えています。
ミッションに「ITによる社会貢献」を掲げて、ベストプラクティスでのサービス提供を通してWebやドキュメント活用を総合的にサポートし、企業競争力を強化する事業を主に手掛けています。
AI開発に必要とする学習データの作成をはじめとした、ITアウトソーシングやデジタルBPOサービスを手掛け、英語圏であるフィリピンのセブ島にオフショア拠点を保有しています。
日本品質・安心・低価格の日系オフショアベンダーとして、自社拠点である「セブITアウトソーシングセンター」で直接雇用されたスタッフのみで作業を実施しています。
管理下にある作業端末のみで行うので、端末の紛失によるデータ流出やプロジェクト内容の情報流出などのリスクがありません。
日本人もしくはフィリピン人のアノテーションマネージャーとアノテーターによるチーム体制を構築し、属人的なばらつきや誤差を極力無くしたデータ収集やアノテーション作業によってデータ収集や教師データの作成を可能としています。
データ収集は、ディープラーニング(深層学習)の学習モデルのプロトタイプ構築に用いるテキストファイルのために、対象Webサイトからテキストデータを収集します。装飾文字や顔文字を取り去るデータクレンジングも実施します。
AI Marketおすすめポイント
・アウトソーシングを自社拠点のセブ島で直接雇用のスタッフのみで作業
・日本品質・安心・低価格での作業を実現
・セキュリティ管理を徹底し、管理下にある作業端末のみで実施
株式会社サイバーテックの概要
住所 | 〒150-0044 東京都渋谷区円山町20-1 新大宗道玄坂上ビル7階 |
設立 | 1998年9月 |
事業内容 | ドキュメントソリューション Webソリューション ITアウトソーシング・BPO |
AI Marketでは
パイルアップ株式会社
パイルアップ株式会社は2012年設立の東京都渋谷区に本社を構える企業です。
親会社である株式会社ネオマーケティングが所有する「SOLPANEL(ソルパネ)」の企画・運営・販売を手掛けています。
ミッションには、「1人1人の個人の力を集積させて大きな価値を生み出し、企業と世の中に貢献する」を掲げ、一人ひとりの力を集積することによる価値提供を行っています。
SOLPANELは人を活用したプロモーション・マーケティングソリューションの提供のために構築された会員組織で、およそ6,000人の登録があります。全国にいる厳選された6,000人以上のアクティブなモニターが、データ収集をはじめとしたサービスのために作業を行います。
データ収集では主に画像収集サービスを手掛けており、事例として、「地方のお店の自社の看板を撮影してほしい。」または、「街頭ビジョンや交通広告などの広告の写真をたくさん提供してほしい」など、ニーズに合わせた画像を、全国にいるモニターが撮影してきてくれます。
AI Marketおすすめポイント
・全国の6,000人のメンバーから構成された会員組織が画像収集対応
・ニーズに合わせた画像を全国のモニターが撮影して提供
・その他のデータ収集もミニタスクとして代行対応可能
パイルアップ株式会社の概要
住所 | 〒150-0036 東京都渋谷区南平台町16-25 養命酒ビル11階 |
設立 | 2012年6月 |
事業内容 | マーケティング支援事業 SOLPANEL(ソルパネ)の企画・運営・販売 |
AI Marketでは
SBイノベンチャー株式会社
SBイノベンチャー株式会社は、2012年8月設立の東京都港区に本社を構える企業です。
ミッションとして、「必要な継続的に新規事業を生み続ける仕組み、およびそれを可能にする事業創造人材の育成」を掲げ、ソフトバンクグループの社内起業制度としてスタートしました。
ソフトバンク株式会社の社内起業制度から誕生したアノテーション代行サービス「TATSUKI」プロジェクトを事業化検討中のサービスとして進めています。
TATSUKIは、ソフトバンクのAIエンジニアが持つ豊富な開発経験から誕生した独自のテクノロジーで運営するAIモデル開発に必要なデータの収集や加工を代行するサービスです。
AI技術を活用したアノテーションプラットフォームによって、AI開発に必要である高品質データを効率的に提供します。
これまでの実績には、数百名から7,000件以上の手書きデータを収集したものがあります。オリジナルチャット機能を活用して、実手書きデータを見ながら、こだわりを1件1件ピックアップし、改行や癖の強い文字抽出など、要件定義にはない潜在の要件を拾いながら収集を実施したということです。
オリジナルチャット機能は、作業データと紐付け、作業者と直接やりとりできる機能です。データ1件1件の個別の要件を擦り合わせながら認識合わせを行えます。
また仕上がったデータをリアルタイムでレビュー可能なので、要件に合わないデータがあった場合には差し戻すことができます。品質チェックを隙間時間に行うことができます。
AI Marketおすすめポイント
・ソフトバンクの社内起業として始まったアノテーション代行サービス
・AIエンジニアの豊富な開発経験を活かした独自のテクノロジー
・プラットフォーム活用で、高品質なデータ提供が可能
SBイノベンチャー株式会社の概要
住所 | 〒105-7529 東京都 港区 一丁目7番地1号 |
設立 | 2012年8月 |
事業内容 | シードビジネスへの投資・育成・管理 |
AI Marketでは
株式会社ブライセン
株式会社ブライセンは、1986年設立の企業で、東京都中央区に本社を構えます。「高品質・高付加価値の追求」「ボーダレス」「事業運営の透明性」を経営理念として定めています。AI開発におけるアノテーション作成実績はトップクラスと言えるでしょう。
株式会社ブライセンでは、日本と海外のハイブリッド体制で作業をしており、日本でしっかりと要件を把握した上で、オフショアで専門のアノテーターを直接雇用しています。課題にフィットしたデータを集め、AIに特化したデータ作成やアノテーションサービスを手掛けています。また、アノテーション業務を行うだけでなく、アノテーション済み自動車走行画像データセットの提供なども行っています。
また、2019年度に富士キメラ総研「2020人工知能ビジネス総調査」アノテーションサービス部門にてシェア1位の実績もあり、業界トップクラスのサービスが受けられるのも魅力でしょう。チェック体制の強化による品質の高さも選ばれるポイントです。オーダメイドの解決策と柔軟なサポートで、急な業務依頼にも対応できます。
AI Marketおすすめポイント
・アノテーションで国内シェアトップの実績を持つ
・品質・コスト・スピードで高評価
・課題解決に柔軟な対応力を持つ
株式会社ブライセンの概要
住所 | 〒104-6591 東京都中央区明石町8-1 聖路加タワー30F |
設立 | 1986年4月 |
事業内容 | 画像調整ソフトウェア(3A)の開発、ライセンシング、販売 スマートフォン、ドローン、監視カメラ向け画像調整業務 カメラシステム(レンズ、モジュール、4K/8K、全天球、多眼、衛星など)の開発、販売 画像認識、自動認識システムの開発、販売 画像ビッグデータのマネージメントシステム開発と運用 WMS(Ware House Management System)の開発、販売 物流倉庫モニタリング・監視システムの開発と販売 チェーンストア向け需要予測型自動発注システムの販売と運用 アノテーション・AI学習用データ作成、受託 組込みシステム開発、業務系システム開発 オフショアラボ立上げ支援コンサルティング 24/365を含む運用保守・監視業務 |
AI Marketでは
最適な会社選びを
いかがでしたでしょうか?本記事では、AI学習用データ収集会社の選定ポイントから、ディープラーニング検定資格を有するAI Marketのプロのコンサルタントが厳選した、AI学習用データ収集会社に強いおすすめの会社を7社紹介しました。
AIモデルは、適切に活用すればコストの最適化だけでなく、収益基盤を改善するための強力な武器になりますが、その元となる教師データの精度が低いと、精度の低いAIモデルになりかねません。
そんな教師データを作成する学習用データ収集会社選定は絶対に失敗したくないものです。とは言え、学習用データ収集会社の選定に時間やコストをかけることも避けたいのが実情ではないでしょうか?
また、各社のサービスを見ても差別化ポイントがわかりにくかったり、そもそもデータ収集会社への相談方法がわからなかったりしませんか?
そのような場合は、ぜひAI Marketへご相談ください。
AI Marketでは
AI Market 運営、BizTech株式会社の代表取締役です。2021年にサービス提供を開始したAI Marketのコンサルタントとしても、お客様に寄り添いながら、お客様の課題ヒアリングや企業のご紹介を実施しています。AI Marketの記事では、AIに関する情報をわかりやすくお伝えしています!
𝕏:@ymorishita
BizTech株式会社HP:https://www.biz-t.co.jp/