http://docs.yahoo.co.jp/info/bigdata/election/2016/02/
>> 第24回参議院選挙の議席数予測を振り返る(前編)予想と実際の一致率が、比例区で94%、選挙区で82%、全体で91%になりました。これを高いと見るか低いと見るかは人それぞれでしょう。
(中略)
(以下略) <<
トータルの数値だけみると、なんとなく高そうな気もしますが、トータルの結果の根拠となる7月7日づけの個別の予想をみると、たとえば「東京選挙区で公明党候補落選」などという、常識的にはまずあり得ない予測(よっぽどの逆風ケースですよ。壮絶なF作戦が展開されているはず。でも、そんなことはなかった)を平気で発表しているあたり、「まだまだだな」という感想が正直なところです。
http://docs.yahoo.co.jp/info/bigdata/election/2016/01/

しかし、それよりも注目すべきは、6月29日づけの「第一回議席数予測」との差。以下のような「すごい」予想をしています。

「共産党16議席」ってのがすごい予測でしたね。実際にはその半分も取れなかったわけでしたが。突然の「人を殺すための予算」発言が効いたのでしょう。
ビッグデータで大はしゃぎしている人々のなかには、「ビッグデータの技術を用いれば、社会のマクロ的設計ができる」と主張する人がいます。しかし、仮にビッグデータによる予測の精度が高まったとしても、今回の選挙のように、社会の構成主体である人々の意思決定が突発的に、そして激しく変動するシロモノである以上は、過去の人間思考・世界構造が今日も続いているという前提に立ち、過去のデータを基に将来を予測するビッグデータの予測手法では、長期的な予測には原理的な困難性が伴うことでしょう。せいぜい、短期的な予測の繰り返しにしかならないでしょう。とてもではありませんが、「ビッグデータによる社会設計」など執行できません。
また、今回の予測では、「前提4:公明党の得票率はネット上の注目度に影響されず、一定幅の中で周期的に変動する」という条件をつけていました。その結果、公明党の議席予想を大きく外すことになりました(繰り返しになりますが、超逆風下でもないのに東京選挙区で公明党候補が落選するなんて、社会常識レベルであり得ない予想っすよw)。統計においてどのデータを採用するのかは調査員の判断です。また、公明党への投票行動のように、世の中には通常の統計データ収集活動では集めることができないタイプの行動様式があるのです。インプットデータが誤っていたら、どんな処理方法であっても、アウトプットデータは間違ったものになります。これは、まさに計画経済が失敗した理由そのものです。
やはり、「ビッグデータによる社会設計」には相当な困難性があるといわざるを得ないでしょう。参議院選挙の結果を受けて私が一番強く感じたのは「3分の2」などよりも、この点でした。