Processingを用いた情報の視覚化 〜ビッグデータの扱い方〜

2376viewsNaosukeNaosuke

このエントリーをはてなブックマークに追加
ビジュアライジング・データ ―Processingによる情報視覚化手法

どういう本か

対象読者

  • 手持ちのツールでは表現できないような視覚化をしたいひと
  • データを探求する好奇心があり何かを伝えたいと思っているひと
  • (技術のレベルは好奇心のレベルに比べると重要ではない)

目的

  • 意思決定ツールとしてのデータの理解を深める

特徴

  • 表示の種類ではなくデータの種類で章分け
  • 視覚化手法ごとに長所と短所について考察
  • 伝達しようとしていることに最も適したものにするためのカスタマイズ手法を重視

1章 情報視覚化の7ステップ

必要な知識

  • コンピュータサイエンス
  • 統計学
  • データマイニング
  • グラフィックデザイン
  • 情報視覚化

データを理解する上で重要なスキル

  • 優れた問いを発すること

適切な問い

  • 数学的に意味があるものよりも、好奇心を刺激するもの

プロセス

  • データ収集(acquire)
  • 解析(parse)
  • フィルタリング(filter)
  • マイニング(mine)
  • 表現(represent)
  • 精緻化(refine)
  • インタラクション(interact)

基本原則

  • プロジェクトの要件はそれぞれ異なる
  • 食べ放題を避ける
  • ユーザを知る(誰?目的は?何を知りたい?)

2章 Processing入門

Processingの構成物

  • 入門向けのIDE
  • 高度な機能をサポートするAPI
  • Javaに似た言語構文
  • 活発なオンラインコミュニティ

Processingの特徴

  • 速度と使いやすさのトレードオフを「スケッチ」したい人向けに最適化している
  • 手っ取り早い
  • 実行速度がインタプリタ方式よりも速い
  • 洗練されたコード構造よりも、手早く試行できることを優先

Processingを使った視覚化で重要なこと

  • 不必要なデータ構造を作らない
  • プロジェクトの規模を考える
  • データベースの利用が必要か考える
  • すべてのデータから始めるべきか考える

3章 マッピング

データを地図に表示する

  • データセットの読み込み
  • 表示
  • インタラクションの基礎

4章 時系列

時系列データをグラフにする

  • ファイルから表を読み込む
  • ラベルやグリッドを表示する

5章 関連と相関

複数次元の値を持つデータを視覚化する

  • 手作業かプログラムを書くか

6章 散布図

郵便番号が地理上の位置にどう関連するのか

  • 一連の流れ

7章 木構造、階層、再帰

ファイルとディレクトリを扱う

  • 階層的で再帰的な構造をどう扱うか

8章 ネットワークとグラフ

関連性を示す

  • Java環境とProcessingライブラリを統合する方法

9章 データ収集

データを収集する

  • データソースを見つける
  • 使えるかの権利を確認する
  • データを加工する
  • 容量的にダウンロードできるか確認する

10章 データ解析

ファイル構造を知る

  • 基本的なファイル形式を認識することは未知のデータ理解の手がかりになる

11章 Javaとの統合

より大規模な開発のためにJavaとの統合方法を知る

  • ProcessingはプリプロセッサによってJavaに変換されJavaとしてコンパイルされる

付録A ActionScriptによる情報視覚化

付録B 参考文献

関連まとめ

本のまとめカテゴリー


コメントを書く