最終更新日:2021-04-10
【AI用語解説】ビッグデータ

ビッグデータ
ビッグデータとは、広義で言えば大規模なデータ群を指しますが、昨今言われるビッグデータとは、データ量が多いことはもちろん、AIなどで活用が可能な様々な種類や形式が含まれ、日々蓄積され、素早くビジネスに活用することが可能なデータ、を指します。
具体的には、以下の3つのVから成り立つデータです。
V | 詳細 |
---|---|
Volume (量) | ビッグデータの「ビッグ」の意味であり、数十、数百テラバイトのデータ量を保有し、日々蓄積されていくデータであることを指します。 |
Velocity (速度) | 蓄積したデータをすばやくDBに保存し、活用できる状態を構築するスピードがあることを指します。 |
Variety (種類) | 取得するデータの種類が、画像や音声、テキスト情報など多岐に渡り、様々な構造化データ/非構造化データが含まれることを指します。 |
合わせて、Value(価値)があるデータであり、Veracity(正確さ)があるデータである必要がある、ということが昨今は言われるようになっています。
つまり、特定の目的を持って集められていないデータや、不正確なデータは、本質的にはビッグデータとしての価値を持ちません。
また、具体的には、以下のようなデータを指します。
総務省「平成24年版 情報通信白書のポイント」から抜粋
