基本情報技術者令和元年秋期 午前問63

問63

企業がマーケティング活動に活用するビッグデータの特徴に沿った取扱いとして,適切なものはどれか。
  • ソーシャルメディアで個人が発信する商品のクレーム情報などの,不特定多数によるデータは処理の対象にすべきではない。
  • 蓄積した静的なデータだけでなく,Webサイトのアクセス履歴などリアルタイム性の高いデータも含めて処理の対象とする。
  • データ全体から無作為にデータをサンプリングして,それらを分析することによって全体の傾向を推し量る。
  • データの正規化が難しい非構造化データである音声データや画像データは,処理の対象にすべきではない。

分類

ストラテジ系 » システム戦略 » システム活用促進・評価

正解

解説

ビッグデータとは、典型的なデータベースソフトウェアが把握し、蓄積し、運用し、分析可能なサイズを超えるほど巨大なデータ群を示す言葉です。一般的には数十テラバイトから数ペタバイトのデータがビッグデータとして扱われます。

ビッグデータが持つ特性として「3つのV」があります。
Volume … データ容量
膨大なデータ量
Variety … データの多様性
テキスト、画像、音声といった多様な種類・形式のデータを含む
Velocity … データ生成速度・頻度
リアルタイムで収集できるデータ・秒単位など高頻度のデータ
ビッグデータの処理は、以前は膨大すぎて処理対象から外されていた多種多様なデジタルデータを統計学的・数学的に分析し、事業に役立つ知見を導き出すことを目的とします。

ビッグデータの特性を踏まえて各記述の正誤を判断します。
  • 1日に何億回も発生するSNSへの投稿を分析することで、市場の反応を分析したり商品改善につなげたりすることが行われています。
  • 正しい。アクセス履歴やセンサーネットワークで刻々と取得されるデータなどのリアルタイム性の高いデータも処理対象とします。
  • ビッグデータの処理ではサンプリングは行わず、対象となるデータ全体を統計学的手法や数学的手法を用いて分析します。
  • ビッグデータは単にデータ量が多いというだけではなく、扱うデータ種類の多さに特徴があります。分析対象には数値や文字列に加え、画像や音声などのマルチメディアデータ、電子メール、センサーの情報、サーバログ、JSONやXMLなどの非構造化データなど多種多様なデータも含まれます。
© 2010- 基本情報技術者試験ドットコム All Rights Reserved.

Pagetop