『データ分析読解の技術』菅原琢(2022)中公新書ラクレ

Blog

管理者Sの読書録 #36

重層的な因果構造を論理的に読み解く力

ひとつひとつの要素間の因果関係が成り立つかどうかを考え、検証するためには、その要素間の関係だけでなく広く因果構造を見なければなりません。言い換えると、複雑な因果構造を捉えることができているかが、要素間に因果関係が成り立つかどうかの判断に影響を与えるのです。…みなさんに知っておいて欲しいのは、ある問題の因果構造を探り、多数の要因を考えていくことは、その物事や現象を理解することと同じということです。何らかの問題も、それが含まれる物事、現象について理解してようやく、解決の方向性を見つけることができるのです。

菅原琢(2022)『データ分析解読の技術』(pp. 37-39)

近年、巷でもてはやされている言葉にビッグデータやデータサイエンスがある。2022年度から採用されている「高校指導要領(平成30年告示)」では、「問題の発見・解決に向けて、事象を情報とその結び付きの視点から捉え、情報技術を適切かつ効果的に活用する力を全ての生徒に育む」ことを目的とした「情報Ⅰ」が必修化されているが、かかる科目では、python等のプログラム言語を用いた演習を4時間設けることとされており、データ分析における実践ツールの体得が必修科目として設定されている。また選択科目である「情報Ⅱ」においては、「データサイエンス」の言葉が明確に使用されており、POSシステム、RESAS、SSDSEなどを用いたデータ分析の実践が掲げられている。「実践事例」として「重回帰分析を用いて体力測定の予測モデルを作ろう」「k-近傍法を理解しよう」が挙げられているのを見るにつけて、隔世の感を禁じ得ない。

本書『データ分析読解の技術』は、こうした時代転換の過渡期に読みべきものとして執筆された、データ分析の入門書である。新書ではあるが、非常に内容の濃い一冊であった。管理者は、量的データを用いた研究は専門でないけれども、今後社会科学に携わっていく身として、また時代遅れのじじいと言われないよう知識をアップデートするためにも、本書を手に取った次第である。著者の専門が政治学であることから、データ分析の事例として選挙制度に関する事項が多く取り上げられていたが、『鬼滅の刃』などの流行りものも議論されていた。数的データに関するトピックを、ここまで分かりやすく言語化して議論している著者の仕事ぶりに脱帽である。

他方で、本書が入門書であることは理解したが、後半になるにつれてだんだんついていけなくなってしまった。本書の要諦は、いきおい、データを丁寧に見る習慣をつけろ、というところだろうか。少なくとも、メディアで示されている安直な相関関係は疑って見た方が良いのだろう。

しかし、散布図に代表される相関関係と因果関係の違いを理解するのはむつかしい。相関関係は因果関係を示すものではないけれど、因果関係を「仄めかす」ものであるというのが、本当にややこしい。

注意しておきたいのは、相関関係と因果関係とは異なるものということです。相関関係は、ある数値の大小が他の数値の他の数値の大小または小大と関連する傾向にあることを示す言葉です。一方が先に動き他方がこれに応じて動く、要素間の先後という因果関係の性質を相関関係は含みません。一方が他方を動かしていることを明らかにするものでもありません。散布図は相関関係を示してくれますが、それが因果関係かどうかの判断は散布図ではできません。散布図は因果関係を意識して描きますが、これでわかるのは相関関係でしかないのです。

菅原琢(2022)『データ分析解読の技術』(pp. 76

結局、この相関関係と因果関係の違いを理解できるかが本書の鬼門であったように思う(地域別集計データの罠や交絡因子の議論はその応用)。これまで管理者は、ちょっとでも相関が見られたならば手を挙げて喜んでいたものだが、本当に反省である。

それにしても、データ分析というのは、語用や行論の側面で大変気を遣う分野であるなと感じた。議論が飛躍しないよう厳格に語用を意識し(大概は断定を避ける表現が使用されている)、かつ緻密に論理展開を重ねているあたり、几帳面な性格でないとしんどいと仕事だと思った。またデータ読解においては、かなりの直観力が求められることも学んだ。結局のところ、データの見極めにおいて必要なのは、読み手側の直観力なのだろう(その分野に精通していることが最低条件)。

それにしても、何ともスッキリしない読後感である。単純に管理者の理解が追い付いていないだけなのだが、例えば終章の「新聞閲読習慣」と「学力」の関係について、結論として「分からない」で終わっているあたり、じゃあ分析って何なんだと感じてしまう。まあ統計やデータサイエンスが万能な薬でないことは、よくよく理解した。

『データ分析読解の技術 (中公新書ラクレ, 756)』(菅原琢)の感想(11レビュー) - ブクログ
『データ分析読解の技術 (中公新書ラクレ, 756)』(菅原琢) のみんなのレビュー・感想ページです(11レビュー)。作品紹介・あらすじ:「データ分析ブーム」がもたらしたのは、怪しい“分析らしきもの”と、それに基づいた誤解や偏見……。本書では、「問題」「解説」を通して、データ分析の失敗例を紹介しながら、データを正しく読...
タイトルとURLをコピーしました