愛と怒りと悲しみの

とある理系サラリーマンのばら撒き思想ブログ

【円グラフ】「あいまいな判断」を武器として逆手に取る戦法【統計の嘘】

 

f:id:cLaCFF:20161130205959p:plain

先日自分がパソコンを立ち上げてみたら、こんな画面が出てきた。何かをインストールしろと言っているようだが、面倒なのでいつも無視している。 

 

ところでこのグラフは、統計結果を表す際に、一か所ずるい表現が使われていることに気付いた。

この手法について調べても意外と出てこなかったので、その詳細を調べてみた。

 

また、統計データというものとの付き合い方と、その判断をする権利のありかについて、まとめてみる。

 

 

目次:

 

 

 

1.「嘘統計」に対する耐性の進化

ここ10年かそこらで、「統計データの嘘」というものはずいぶん見破られやすくなったと思う。インターネットによる情報革命により、昔は押し通せていた嘘が、すぐに指摘されるようになった。

 

f:id:cLaCFF:20161130210054j:plain

例えば、ニュース番組でこういうグラフが出てきたら、すぐにツイッターで突っ込みが入るようになった。インターネットの普及により、個々の判断力による正義は着実に育ってきているように思う。

 

統計データで嘘をつく手法の実例は、検索すればたくさん出てくる。

以下のサイトは見やすいしお勧めだ。

id.fnshr.info

 

また、こんな風に偽グラフをでっちあげてくれるような面白ツールも見つかった。

Wonder Graph Generator

 

 

2.円グラフという表現手法について

f:id:cLaCFF:20161130205959p:plain

そこで改めて今回のグラフをみると、円グラフが0時から始まっていない。

円グラフが0時から始まっていない故に、56%という数値が上からかぶさる形になり、より大きく見えてしまう。56%のピースが、円の90度単位の区切りのなかで一番目に入りやすい0時の線を突破していることで、より大きく見えているように思う。

f:id:cLaCFF:20161130210247p:plain

例として、同じような5%・9%・30%・56%のグラフを三種類並べてみた。

56%という項目を一番強調したいなら、確かに一番右のグラフがよさそうじゃない?

 

しかしさすがパソコンの会社であるDellが出しているグラフであり、それ以外にはそこまで嘘はないように思う。数値の割合は角度の通りだし、色使いにも不自然な点はない。

項目の分け方が「データ損失に備えてバックアップソフトを用意しろ」という結論に向けているようには見えるが。

 

そこで今回重要な点は、「円グラフは0時から始めないといけない」というルールは実は存在していないということだ。エクセルの機能でも、簡単に回転ができる。

 

円グラフは元々、通常のxyグラフなどのように、科学の世界で定義されたものではない。最初に使い始めたのはコンサル業界であるらしい。

色々調べてみたが、JISや業界規格といった、科学以外で円グラフのルールが定義されている共通の文書も、見つからなかった。

 むしろ、円グラフはあいまい表現だから使ってはならない、という例はいくつか見つかった。コンサル会社などでは、このような教育がなされているらしい。

 

そういうわけで、今回Dellはルール違反もしていないと言えると思う。

「特定の結論に導きたい」という意志は発揮されていたのかもしれないが。

 

 

3.統計結果を表現するルールについて

統計学とは表現手法の研究であり、証拠や経験則を提供する目的の分野ではない。

統計学は数学と同じで、人間がルールを作り、それを解釈して利用する分野である。

自然科学というよりは、文学に近い。

 

大げさに言えば、統計の表現にルールなどない。

円グラフや棒グラフなどは、読者の目に馴染みがありそうだからその場で選んでみた手法、といった程度の意味でしかない。

「円グラフはコンサル会社では使われていないから使っちゃダメ」ということも、そのコンサル会社の範囲の正義でしかない。

 

さらに言ってしまえば、例えばこれのようにデタラメな円グラフであっても、「新しい表現方法のグラフです!名前は”えんぐらふ”です!」と言ってしまえば、問題がないことになる。

一応、判断材料として役に立たないということがすぐにばれてしまうから、表現方法としては定着されないで駆逐されていくが、そうやって駆逐されるまでは有効性を帯び続けるわけだ。

 

 

4.人間の知性に伴う、「判断をする責任」

統計結果は自由に表現が出来るものであり、それ自体は何かを証明する証拠にはならない。

統計結果を見て、それをどう判断するかは別の問題である。

本当に重要なほうは、統計の表現方法ではなく、それをどう判断するかの方だ。

 

例えば、市民の全員にアンケートをして、「喫煙者は~%でした」という統計結果を得られたとする。

この「喫煙者は~%だった」という地点までならば、全員に共通の事実であると仮定できるが、それで「喫煙者が多い」と言う判断をすることは別の問題である。

多いか少ないかの判断は、各自に委ねられるあいまいなものだ。

 

当ブログの参考文献の記事でも書いたように、根拠が示された後に、判断するのは読者の仕事である。例え参考文献がウィキペディアであろうとも、その内容が現状で正しいのならば、それは有効である。

clacff.hatenablog.com

 その判断を他人に委託しようと思うのならば、いくつかの権限は捨てなければいけない。

理解の手間を割くことができない、という事情で、判断をゆだねるということは有りだが、その場合は判断結果に文句を言ってはいけない

判断をゆだねることを辞めるか続けるかは選べるが、判断結果にケチをつけることはできない。

 

 

5.判断をする権限を、武器に転用する者たち

また、統計は判断材料にはなるが、それだけでは完璧な証拠にはならない。

どんなに情報がそろっていても、すべてを完全に証明できるなんてことは自然界にはあり得ないため、最後の判断自体は、誰かがエイヤと踏まなくてはいけない。

 

それはそうなのだが、では誰がその判断をするのか?

先述したように、読者それぞれが判断をすることになっているが、会社などの組織で判断をしなければならない場合は、その役割と権限を委託されている社員が行うことになる。

すなわち大抵の場合で、「上司」が行うことになる。

 

責任を持った上司が「判断」をしなければならないわけだが、統計データというものは、元々絶対的な答ではないため、そのあとの判断については曖昧さを含ませざるを得ない。

そういう状態で、先日の記事で述べたような、権力を持った側の「チート武器」が好き勝手に使われる。

clacff.hatenablog.com

 権力を持った側が、答えを一方的に制定できてしまう。

その一方的な判断をするのに、データが多いとか少ないとか言った要求をすることが出来る

判断の権限を一旦渡しておいて、すぐに取り上げるというカウンターも可能だ。

統計は判断材料にはなるが、証拠にはならない、という事実を意図的に無視できる。

 

 

統計データという判断材料は、「武器」である。

マスコミや上司など、その武器を一方的に取ることが出来る強者も、世の中にはいる。