統計学でできること、できないこと
2017/05/25
統計学は魔法の箱ではない。
対象(母集団)のニーズ、傾向を知ることはできる。しかし対象(母集団)に特定のアクションを促す方法を発案できるわけではない。
相手をより深く知ることはできる。しかし相手を動かすためにどんなアクションをとればいいかを教えてくれるわけではない。
身長150cm、女性、22才、O型、猫より犬派、朝はパン、好きな食べ物は茶碗蒸し、好きなタレントは菅田将暉、趣味は一人旅、鎖骨のラインにグッとくる、月曜日22時は96%の確率でため撮りしてあるドラマを消化する……
こういった背景を雄弁に語ってはくれるものの
「じゃあさ24才年収200万顔面偏差値50の自分がこの子から付き合ってほしい!って思ってもらうためには具体的に何したらいいの?」
という質問には沈黙する。
これがデータマイニングの現状であり、統計の限界だ。
マクロは教えてくれるが、ミクロには沈黙する。
背景は鮮やかに描いてくれるが、前景には粗いモザイクがかかる。
そもそも個別具体的な現象とそれを抽象化したデータ(傾向)には大きな飛躍がある……というか次元が違う。全体の傾向を掘り下げていったその延長線上に具体的な個別なアクションがあるような気がしてしまうのはよくある錯覚
もっと乱暴に言い換えれば、統計からはじき出された傾向というのはいわば「概念」であり、「現実」とは少なからず乖離している。
もちろん、こういったデータを知ることで何も手がかりがないよりは当たりがよくなるはずだ。
そう。手がかりなのだ。当たりをよくするための。
データサイエンスは助言はしてくれるが、発案してはくれない。
当てるのは自分であり、当てる方法を考えるのも自分である。
それを忘れてはいけない。
……今後の技術発展で当ててくれるAIが出てくる可能性は十分にあるからまぁ断言はできないんだけども