Fundamentals of Data Visualization | 4 color scales 要約

4 Color scales

データ可視化における色の使用例は3つ
使用方法によって使う色の種類が全く異なる

  1. データのグループを区別
  2. データの値
  3. 強調する

4.1 Color as a tool to distinguish

グループを区別するために色を使う

Q: どんなデータにこの手法が有効か?

A: 順序を持たない値を区別するために色を使う
国、製品のメーカーなど

特徴1

質的な色(qualitative color)を使う
–> 互いに等価であり、明確に区別できる

特徴2

どの色も他の色に比べて目立たない

–> 順番に明るくなるような色は順序を作っているように見えるため、「順序を持たない値を区別するため」には適さない

カラースケールの紹介

著者の推しはColorBrewerプロジェクト(「かなり明るい」から「かなり暗い」の幅が広い)
ColorBrewer: Color Advice for Maps

使用例

米国の各州の2000年から2010年までの人口増加率
各州を人口増加率の高い順に並べ、地域別に色分け

この色分けでわかること
同じ地域の州が同じような人口増加を経験していることを強調
特に、西部(West)と南部(South)の州は人口増加が最も大きく、中西部(Midwest)と北東部(Northeast)の州は人口増加が非常に少ない

Tさん
Tさん

(特徴2で定義された通り)確かにこの中に一際目立つ色があると、余計な考察をしてしまう

4.2 Color to represent data values

データの値を表すために色を使う
シーケンシャル・カラー・スケールを使う

Q: どんなデータにこの手法が有効か?

A: 所得、温度、速度など、順序や度合いを持つデータ

特徴1

どの値が他の値より大きいか小さいかを表せる

特徴2

特定の2つの値が互いにどれだけ離れているか
カラースケールがその範囲全体にわたって均一に変化するように知覚される必要があることを意味する(?)
(The second point implies that the color scale needs to be perceived to vary uniformly across its entire range.)
※「おそらくこのグラフは色の濃さで度合いを表しているな!」と勘づいてくれる必要がある

シーケンシャル・カラー・スケールの紹介

Sequential scales(順次尺度)は、単一の色相(例:濃い青から薄い青へ)に基づくものと、複数の色相(例:濃い赤から薄い黄色へ)に基づくものがある
濃い赤、緑、青から薄い黄色、濃い紫から薄い緑など、自然界で見られる色のグラデーションに従う傾向がある

その逆(濃い黄色 –> 薄い青)は不自然で、「連続した尺度」とならない(下の図を作ってみた)

使用例

テキサス州の各郡の年間中央値所得をそれらの郡の地図にマッピングした例
このような地理的地域の地図を描き、データ値で色分けした地図はコロプレス(choropleths)と呼ばれる

Tさん
Tさん

この図の1つの郡の面積の差がもっとある場合、受ける印象が違ってくるのかも

テキサスには254の郡がある、そこに例として中央所得が超高く、面積も広いABC郡を追加


色の面積的には約1/6が$80,000に見える
郡の総数からの割合では、約(1+3)/255が$80,000
屁理屈っぽいけど。。

発散カラースケール(diverging color scale)の紹介

Q: どんなデータにこの手法が有効か?

A: 正の数と負の数の両方を含むデータセットなど

特徴

ある値がプラスかマイナスか、またゼロからどちらの方向にどれだけずれているかがすぐにわかる
発散スケールは、2つの連続したスケールを共通の中間点でくっつけたものと考えることができ、通常は薄い色で表される

注意

中央の明るい色から外側の暗い色への進行が、どちらの方向でもほぼ同じにする
そうでないと、データ値の知覚される大きさは、それが中点値より上にあるか下にあるかによって変わってしまう

使用例

テキサス州の郡における白人の割合
パーセントは常に正の数だけど、中央値を設定すれば
50%という中間値が設定され、50%を超える数値は白人が多数派であることを示し、50%を下回る数値はその反対を示す

ブルー系: 白人が多数派
薄い色: 白人と非白人がほぼ同じ割合
茶色系: 白人が少数派

4.3 Color as a tool to highlight

アクセント・カラー・スケールを使ってデータを強調する

Q: どんなデータにこの手法が有効か?

A: 伝えたいストーリーに関する重要な情報を伝える特定のカテゴリーや値がある

特徴

図の他の部分に対して鮮やかに目立つ色または色のセットで着色する

アクセント・カラー・スケールの紹介

控えめな色のセットと、それにマッチする、より強い色、暗い色、および/またはより彩度の高い色のセットの両方を含むカラー・スケール

使用例

図4.2の変形版として、テキサス州とルイジアナ州を強調

両州とも南部に位置し、すぐ隣同士だが、一方の州(テキサス州)は2000年から2010年にかけて全米で5番目に急成長したのに対し、もう一方の州は3番目に低成長
テキサス、ルイジアナの地図場所 –> アメリカ留学の都市情報 手数料無料の海外留学推進協会

注意

アクセント・カラーを使う場合、ベースライン・カラーが注目の的とならないようにすることが重要
ベースライン・カラーをカラフルにしすぎて、アクセント・カラーと読者の注意を奪い合ってしまうという間違いを犯しがち

ベースライン・カラーが注目の的とならないようにするには?

強調表示されたデータ・カテゴリーやポイント以外の図中の要素から色をすべて取り除く

water polo(水球), フィールド競技などスポーツ選手の体脂肪率と身長を表したグラフ
fieldは棒高跳びとかハンマー投げ
トラックアスリートは、人気スポーツに参加する男性プロアスリートの中で最も背が低く、痩せている