先日NHKで放送された「AIに聞いてみた どうすんのよ!?ニッポン(http://www6.nhk.or.jp/special/detail/index.html?aid=20170722)」なる番組の内容が大雑把すぎてプチ炎上していますが、この番組の内容は、ここ最近のAIに関する誤解の総マトメの様な印象を持ちました。

「NHKでは、人口動態や介護、医療、格差、消費など様々な社会を映し出す5000を超える公共のデータを入手。『風が吹けば桶屋が儲かる』といった具合に、複雑に、間接的に影響し合っているそれぞれのデータの関係性をAIが解析し、日本の社会構造を詳らかに分析した。」

番組説明では上記のように書かれており、日本を変えるのは「40代独身男性の選択だ」という結果で締めていました。

しかし「AIが判断しました」というのは実は大きな間違いで、現時点では、AIというのは多くの場合、データベースかつデータ分析ツールにすぎないという点に注意が必要です。

日本でも他の国でも「AIが答えた」云々という結果の少なからずが、実は単なるロジスティック回帰分析だったりするんですが。

ロジスティック回帰というのは英語でいうとLogistic Regressionでありますが(英語だとすんなり分かりやすいですね)、あることに対する何かを知りたいのなら、「独立変数」(Dependent variable )「従属変数」(Dependent variable )を決めなくちゃなりません。

その前に、そもそも「知りたいこと」の仮説を建てなくちゃなりませんが、その仮説を考えるのはAIではなく人間様です。

例えば「男性は女性よりマクドナルドが好きなはずだ」という仮説を検証したいなら

独立変数:性別
従属変数:マクドナルドのハンバーガーが好きですか?(0−10で表してください)

を定義して、「マクドナルドのハンバーガーが好きですか?」の男女別の回答を集めることになるわけですね。

「男性は女性よりマクドナルドが好きなはずだ」を明らかにするのに、どんな変数を設定するのかを決めるのは人間様なので、AIが判断してるわけではありませんね。

さらに、NHKは莫大なデータをAIに入力したといっていますが、「どのデータを選ぶか」によって分析結果は変わってきますが、「何を入力するかを決める」のもAIではなく人間様です。

「どこからデータを集めるか」「データの質が良いかどうか」を判断するのも人間様です。

例えば「マクドナルドのハンバーガーが好きですか?」の回答を集めてくださいをお願いした場合、調査員Aさんは神奈川県のZ高校の生徒から集めた50個の回答だけ、Bさんは北海道、大阪、千葉の30の街の主要駅前を歩いていた人から集めた5万個の回答。

Aさんのデータと、Bさんのデータのどちらの質が良いかを判断するのも人間様です。これはAIには判断不可能なことです。

分析の結果を解釈し、「何々をするべきだ」「何の傾向がある」というマトメをするのも人間ですし、さらにそれを使って何かをするのも人間であって、AIにはそこまでやる能力がありません。

番組では

「病院数を減らせば健康になる人が増える」

という結論を出していましたが、「病院数」と「地元の人の健康度」の因果関係の解釈にも様々な側面があります。

病院数が減ったので、病気の人は他の街に引っ越してしまったから健康度があがったのかもしれないし、死ぬ人が増えて健康度が上がったのかもしれないし、病院集約化で各病院への補助金の金額が増えて、治療の質が上がったかもしれない、と様々な背景が考えられるわけですが、その辺を考えるのもAIでは無理です。

社会調査というのはなかなか難しくて、キーになるのはどういうデータを集めて、どういう仮説を建てて分析するかということで、AIに放り込みさえすれば様々な検証が可能というわけではなく、現時点ではIBMのワトソンだって単なるでかい検索エンジンであります。

その辺を十分説明しないで、AIというバズワードで視聴率を稼ぐのはいかがなものでしょうかね。