今必要なデータの「伝え方」を教えます
新型コロナの感染状況が注目されるなど、データを伝える「データ可視化」に対する関心が高まっている。ここで大切なのはデータの使い方の前段階である「データの伝え方」をどう設計するか。「人が何となく思っていることを形にする」、ステレオタイプを助長するデザインを使わない鉄則、プロトタイプの作り方……報道・広報・営業などデータを扱う全ての人へ。東洋経済オンラインのデータビジュアルコンテンツで注目を集めた、データの俊英が手法をお伝えします。

10回(最終回) データ可視化と報道・社会

 これまで長らくお付き合いいただきましたが、今回が最終回です。データ可視化の歴史や報道との関わり、社会的な意義などを解説します。



データ可視化の歴史的な傑作

 現代の私たちが目にする「データ可視化」といえば、大半が棒グラフ、折れ線グラフといった「グラフ」です。しかし実はデータ可視化の歴史において、単独のグラフによるシンプルな可視化は比較的新しいものです。歴史的に見ると、複数のグラフを一度に見せたり、地図と組み合わせるなど、技巧的な工夫を凝らした作品が数多く生まれています。

 歴史的なデータ可視化の制作者として、まず最初に名前が挙がるのがフローレンス・ナイチンゲールです。一般的には看護師・看護教育におけるパイオニアとして知られ、「クリミアの天使」とも呼ばれたナイチンゲールですが、同時に統計学者としてもめざましい功績を残しました。むしろ本人は自身につけられたニックネームをあまり好んでいなかったようです。

 1820年フィレンツェで生まれたナイチンゲールは看護師としてロンドンで働きますが、クリミア戦争が勃発すると従軍看護師として現在のトルコ・ユスキュダルにある野戦病院に配属されます。そこで劣悪な衛生状況によって兵士が死亡するのを目の当たりにしたナイチンゲールは、軍部を説得するため独自のインフォグラフィックを制作します。

ナイチンゲールのローズ・ダイアグラム(Wikimedia Commons

 これは兵士の死亡原因を集計したものです。1年間を12の扇形に分け、右側の円が1954年の4月から翌年3月、左側がその翌年を示しています。最も内側の赤い(紙の褪色によってくすんでいますが)部分が負傷、中間の黒色がその他、最も外側の青色が感染症による死亡を表しています。

 この特徴的な扇形を集めた図表はナイチンゲールが自ら考案した視覚表現です。現在ではその形から「ローズ・ダイアグラム」「鶏頭図」「鳥のとさか」といった名称で呼ばれます。

 ここで読み取れる最も重要なメッセージは「兵士の死亡原因は負傷そのものではなく感染症の方が圧倒的に多い」です。図表左下の文章でも、青色の部分は「予防・軽減可能な感染症によるものである」と強調されています。ナイチンゲールはこのデータをもとに軍部と交渉し、野戦病院の衛生状態を改善するようにはたらきかけ、死亡率を劇的に低減させました。「データをもとに仮説を立て、視覚的に理解しやすい表現を考案して周囲を説得し、状況の改善を図る」というデータ活用のお手本のような一連のプロセスです。

 地図によるデータの可視化も19世紀中盤に優れた事例が出ています。1854年、イギリスの医師ジョン・スノウは当時ロンドンで流行していたコレラの発生源を突き止めるため、死亡した患者の住所を地図に表現しました。

ロンドンのコレラ流行における死亡者の分布。ジョン・スノウによる元図をチャールズ・チェフィンズが描き直したもの(Wikimedia Commons

 この地図では死亡者の住所をもとに、道路の横に1件ずつゲージのような長方形を積み重ねています。この地図を見ると、症例は特にブロード・ストリート(現在のブロードウィック・ストリート)の周辺に集中していることがわかります。住民への聞き込みも含めてスノウはコレラの原因が公衆給水ポンプにあると推測し、ポンプの使用を禁止しました。

 地図による可視化で地理的な傾向を把握するのは現代でも広く使われていますが、それが効果的に使われた初期の事例です。

 もうひとつの例が、ナポレオン1世のロシア遠征を表現した土木技師シャルル・ジョゼフ・ミナールによるインフォグラフィックです。1812年、フランス帝国の大陸軍を率いたナポレオンは国境を超えてロシアに侵攻しましたが、敗退してフランスに退却しました。1869年に作られたこのインフォグラフィックは、遠征における大陸軍の移動を地図上の線で、兵力を線の太さで、退却時には線の色を変えて表現しています。下の表は退却時の気温です。

ミナールによる遠征中の大陸軍の移動経路と兵力増減(Wikimedia Commons

 このグラフィックを見ると、大陸軍がモスクワ到着を経てフランスへ退却するに至るまで、兵力が激減していることが見て取れます。それもモスクワなどの激戦で減ったわけではなく、退却する道程でも大きく数を減らしています。ナポレオンがロシア軍の遊撃や厳しい寒さ(下の表を見ると、気温は最もひどい時でマイナス30度を下回っていたことがわかります)に苦しんだことがこのグラフィックからわかります。

 地図、兵力の規模や移動経路、気温などさまざまな要素を1枚の紙に表現した、総合的なインフォグラフィックの代表事例だといえます。

 データ可視化が活用されていたのは海外だけではありません。戦前の日本でも多様なインフォグラフィックを使った出版物がありました。そのひとつが1935年に旧東京市から公開された『東京市勢圖表』です。

『東京市勢圖表』より(画像はDavid Rumsay Map Collectionから)

 人口、土地、天候、関東大震災による焼失地域など、当時の社会統計がインフォグラフィックで体験できます。使われているグラフィックも、シンプルなグラフに始まりサンバースト図(ドーナツグラフを重ねて階層や分類を表現する図表)、マリメッコ・チャート(カテゴリーに別れたデータについて縦軸と横軸で全体に占める割合を表現する図表)など多彩です。

 これらの例からわかるように、19世紀半ばに黄金期を迎えたデータ可視化は、現代の「グラフ」よりも複雑な視覚表現を用いることが少なくありませんでした。



「グラフの父」ウィリアム・プレイフェア

 では現代のグラフはどのように発明されたのか。棒グラフ、折れ線グラフなどの原型と見られる作品は数百年の歴史を遡る必要がありますが、それらを定式化した人物として知られるのがウィリアム・プレイフェアが知られています。

 プレイフェアは後に数学者となるジョン、建築家となるジェームズを兄に持ち、1759年にスコットランドで生まれました。牧師であった父が早くに亡くなり、ウィリアムは長兄ジョンから教育を受けて育ちました。ジョンは後にエディンバラ大学の自然哲学の教授となりますが、ここでウィリアムは兄の薫陶を受け、観察結果を視覚表現に置き換えることを学びました。その後、蒸気機関を実用化したことで知られるジェームズ・ワットの製図工兼助手などを経て作家活動に転じ、1785年に『商業および政治のアトラス』を出版します。

 プレイフェアの最大の功績は、この『アトラス』や1801年に出版した『統計簡要』などにおいて、棒グラフ、折れ線グラフ、円グラフといった視覚化表現を発案するとともに、データ視覚化にまつわる様々な要素や表現方法を現代でも通用する形に定式化したことです。『データ視覚化の人類史』では「近代データグラフィックスの父」「グラフ手法の父」と表現されています。

 以下は『アトラス』に登場するグラフ(スコットランドと各地域との輸出入)です。折れ線そのものだけでなく、グラフ上部に位置するタイトル、数値の比較を用意にするためのグリッド線、横軸や縦軸に付された数値・文字のラベル、グラフ下部の注記など、現代の私たちが使っているグラフとほぼ同じ形に整理されていることがわかります。

Wikimedia Commons

 厳密に言うと、棒グラフや折れ線グラフはプレイフェアが歴史上初めてというわけではありません。たとえば『アトラス』出版の約30年前にあたる1754年には、フランスの地理学者フィリップ・ビュアシュと製図家ギヨーム・ド・リルが35年間にわたるセーヌ川の水位を棒グラフで表現した例があります。プレイフェアの功績はむしろ、上記に挙げたような各種の要素を用いて、広く社会におけるグラフ表現を実用化したことにあります。

 『アトラス』は出版の翌年に当時のフランス国王ルイ16世にも献上されました。またスコットランドの歴史学者ギルバート・スチュアート博士は『アトラス』の書評において「これこそ新しい、他と異なる、平易なやり方で、政治家や商人に情報を伝える方法である」とプレイフェアを絶賛しています。

 一方で、プレイフェアが広めたデータ可視化の手法は、決して万人から高く評価されていたわけではないようです。

 『データ視覚化の人類史』では「プレイフェアの洗練されたグラフのイノベーションは、しばしば無視されるか、ときには評判を傷つけられた。たとえばイングランドの国債に関するグラフは、「単なる想像上の遊び」と批判された(p.174)」とされています。

 プレイフェアが師事したジェームズ・ワットも「グラフ表現は正確さに欠ける」「表に示されるデータほど信頼されるものには見えない」とプレイフェアを批判しています。

 誇張をせず可能な限り正確な理解を提供することは当然として、データ視覚化が社会にもたらす価値は欠点を補ってあまりあると筆者は考えています。現代社会にデータ視覚化があふれていることがその証左ですが、プレイフェア自身はその意義についてこう述べています。

(訳者注:グラフを使った)表示モードの長所は、情報の獲得を容易にし、記憶がそれを保持するのを補うことである。……目は、それに対して表現され得るあらゆるものの最も生き生きとした、最も正確な概念を与える。異なる数量間の比率が対象となるとき、目は予測もできないほどの優位性をもつ。(『統計簡要』1801, p.14、p.141にて引用)



データによる報道はどのように進化してきたか

 データを「伝える」上で最も重要な分野のひとつが報道です。現代ではデータを活用した報道をデータ報道(データジャーナリズム)と呼びますが、確認できる最も古い事例のひとつが1821年の英国Manchester Guardian(現在のThe Guardian)による報道です。

The Guardian Data Blog: "The first Guardian data journalism: May 5, 1821"

 紙面に表で示されているデータは、マンチェスターおよびサルフォード地区における学校別の生徒数と支出額です。どれだけの生徒が無償教育の対象になっているか=貧困状態にあるか、がわかります。公式発表では従来8,000人程度だとされていた貧困状態にある生徒は、実際には25,000人に上ることがこの記事によって明らかとなりました。こうした報道は現代では決して珍しくないものですが、当時は「センセーションを巻き起こした」とされています。

 1900年代後半に入ると、コンピュータの発達を報道にも活用する動きが出てきます。たとえばアメリカのテレビ局CBS1952年の大統領選挙において「Univac」という名前のコンピュータ(世界最初のコンピュータ「Eniac」の次世代機)を使って選挙結果の予測を試みました。このような報道はCAR(Computer Assisted Reporting)と呼ばれました。

 その後、1970年代に入ると社会科学や行動科学的な分析・研究手法を報道に活用する「精度ジャーナリズム(Precision Journalism)」と呼ばれる報道が現れます。

 精度ジャーナリズムの有名な事例が、1980年代にデータ可視化を報道に活用した「Color of Money」です。

The Color of Money(Power Reportingより)

 ここに表示されている地図は、上が黒人居住区、下が「持ち家が銀行融資を受けている割合が少ない地域=銀行が住宅に融資したがらない地域」を示しています。両者が見事に重なることを示し、黒人の持ち家オーナーに対して銀行が資金融資を渋る現状を報告したものです。この問題を報じた地元紙The Atlanta Journalの記者Bill Dedmanは1989年のピューリッツァー賞を受賞しました。

 さらに2000年代に入ってコンピュータが「11台」の時代になると、データを活用した報道はさらに普及していきます。この時代の最も大きな変化は、何よりも読者が報道を体験する媒体が紙からデジタル端末(パソコン、初期の携帯電話、スマートフォンなど)に変わったことです。

 たとえば、2011年にイギリスで相次いで発生した暴動ではGuardianが当時はまだ珍しかったGoogleマップを使ったインタラクティブな地図を制作しています。

The Guardian "England riots: was poverty a factor?"より

 当時、イギリスではロンドン北部から波及して各地の都市で暴動が起こっていました。デーヴィッド・キャメロン首相は「暴動の原因は貧困ではない」としていましたが、これにデータで反論する形で制作されたコンテンツです。逮捕者の住所と地域ごとの相対的な貧困/富裕度を地図に表示し、逮捕者の大多数が貧困地域の出身者であることを表現しました。

 同時期、紙にはないデジタル端末の表現力を最大限に活用するコンテンツも出てきました。その嚆矢が2012年にNew York Timesの発表した「Snow Fall: The Avalanche at Tunnel Creek」です。同年2月にワシントン州で起こった雪崩について、動画によるインタビュー、インタラクティブなグラフィック、航空映像、アニメーションなど様々なコンテンツを6部構成のストーリーにまとめ上げたものです。

The New York Times "Snow Fall: The Avalanche at Tunnel Creek"より

 このように動画やグラフィックなどを駆使するコンテンツは「イマーシブ(=没入感のある)・コンテンツ」と呼ばれます。取材記事、デザイン、デジタル技術を総動員して作られたこのコンテンツは「未来のオンラインジャーナリズム」とも呼ばれ注目を集めました。

 このような経緯、そして新型コロナ禍を経て現代の日本でも「データ報道」「デジタル報道」の機運が徐々に高まりつつあります。特に近年の大きな変化を挙げるとすれば、やはり読者=ユーザーが自分たちのデジタル端末で報道コンテンツを閲覧するようになったことです。これによって、従来のデータ報道における価値であった「データの分析によって新しい事実を見出す」ことに、「今までは実現できなかった表現手法で伝える」ことが加わったといえます。

01