2013/11/12

素人だけどニコニコデータ研究会行ってきた 感想レポート1 データサイエンティスト・石井晃先生基調講演


ニコニコデータ研究会 というものに行ってきました!とにかく長いので、二、三回に分けてレポートしたいと思います!
ニコニコ学会βに属する研究会のような位置づけで、幅広く、”データ”に興味がある人が集まって発表しよう! というものです。

今回、ニコニコ学会βの関係で誘っていただき、全く本当になにも分からないのですが、面白そうなので行ってきました!
(入場は誰でも無料でいけます!)

わからない単語はそのままメモりました!  
議事録メモみたいな感じとも言えますが、ご覧ください!

11/13new!  石井晃先生が当日のスライドを可能な限りで公開してくださいました!
http://www.slideshare.net/ishii-akira/2013-11-28183918
石井晃先生Twitter @ishiiakira  (アイコンが素敵!)


ーーーー
開会の言葉

ニコニコ学会とは、職業的に研究をしているのではなく、野生的に研究をしている野生のの研究者に発表場所を与える事がミッションで作られました。
また、垣根を取り払って横の交流を作ろう!というのも大事なミッションです。

ニコニコデータ研究会は、そのなかでデータ好きがあつまった会の様です。

もともとニコニコ動画を対象としたデータ研究が楽しい!ということから第一回をしたら成功! 二回目はニコニコデータセットというニコニコ動画のビックデータ(メタデータ)を中心としたセッションだったそうです。
データ分析のなかでもかなり”たのしい”に振ってあるけど、ノンジャンルだし、分析方法でもいいし、要するになんでもあり!プロアマ問わず、いろんな方が発表されていて、話題の振れ幅がかなり大きい、カオスセッションでした。

ーーーー

基調講演 鳥取大学石井晃先生 鳥取大学工学研究科

データ分析のプロで、最近AKBの総選挙を数学で予測されたことが話題になった、すごい方です。 
データ分析というのは、もともと今あるものを改善するために行われてきましたが、この頃”予測”という分野でもデータ分析が大きく活用されてきたそうです。

まず、データ分析の基本的なhow toについて話されました。
先生は、ヒット現象を数理モデルで探る研究をされていて、社会の人々の興味を、映画、飲み物、AKBを題材として研究されてきました。


話題の強さと人気の強さは、ツイッターやブログでの書き込み数と大体一致するだろうって思いませんか?

でも、実はそうでもなかったりするんです。
宇宙兄弟、テルマエロマエってゆう映画ありましたよね。大体同時期に上映されたそうなのですが、宇宙兄弟の方が書き込み数が多かったのにもかかわらず、興行収入は宇宙兄弟の惨敗だったそうです。

ツイッター、露出度に比例しないということを、なぜだろうと分析したら、いろんな人から興味をもたれたと先生。


数理モデルでどのように予測されているのか、概念を教えてくださいました。
例えば何かをしているときに、大きな音が聞こえたりしたら気になりますよね。そして音の方をやっていることを中断してみてしまうとき。この動きをさせた力を”意欲”とします。この”意欲”を数値化して論ずることができれば、数理モデル(数学によって記述されたモデル)として、どれくらいの人がそれに興味を持ったのかが方程式で表すことができるので、その方程式を使って予測することができるという事だそうです。

広告宣伝、口コミ、うわさ間接口コミ

映画興行収入とブログの書き込み数のグラフの形はほぼ一致するそうです。
しかし、そのブログを書いた人はほんとにみてるのかというのが知りたいですよね。
”おくりびと”を調べたところ、書いた人と行った人とは時系列的に割合は一致 (入った人はほぼ一割)だったそうです。とすると、ブログの書き込みから、その映画のピークを知れるってことですね。

...という、すごい映画データの分析、実はすべて目視だそうで驚き。というのも、ロボットでやらせるには、映画の感想は悪いこと言ってるのか、良いこと言ってるのかが非常に分かりにくいものが多く、ご判断がどうしてもあるからだそうです。
としてもすごいですね...

この後の講演でもかなり出てくるのですが、こうやって人海戦術でとことんデータを取る事を、
”根性マイニング”というそうです
(データマイニングとは、小売店の販売データや電話の通話履歴、クレジットカードの利用履歴など、企業に大量に蓄積されるデータを解析し、その中に潜む項目間の相関関係やパターンなどを探し出す技術。だそうです IT用語辞典 e-words より)


”アバタ―”はちょっと特殊だったそうです。というのもはじめての3Dだったので、いろんな映画館で3Dの見え方を試してみるなど、イレギュラーな盛り上がり方があったからだとか。

もう一つ映画関係で面白いのが、
データグラフを、公開日ですべての高さを合わせてみると、公開日以降の減衰具合を映画間で比較できるそうです。そしてだいたい興行成績とマッチするそうです。


次は、音楽ダウンロード
数とブログ書き込み数は一致しないそうです。というのも、ダウンロードしてわざわざブログに書くのって、だいぶ聞いていいな!っておもってからですもんね。
ただし、ダウンロード数とその曲の広告の頑張り具合は一致するそうで。要はお金を掛ければ曲は売れるんですね(笑)


もうひとつ、飲料関係でぺプシのフレーバーのはなし。 
このフレーバーシリーズは広告してないから、口コミで広がります。
この中で一つ話題にされ方の数のグラフが変だったのが、ソルトヲーターメロン。
あるブログで、本物のスイカに塩とペプシ入れたら似るかとかいう記事がツイッターでもりあがったからだとか。
私も読んだ気がします。w 面白かったw


深夜アニメを委託解析したこともあるそうです。 四週目以降の話題にされ方は数理モデルでだいたいあっちゃうそうです。四週目までいかに面白くするかがアニメの視聴率にかかわるんですね。

そして以外にそんな話題にはならず、発表日だけツイッターで盛り上がるくらいだとか。
全体的に、ツイッターは突発的に盛り上がり、。ブログは少し遅れるけど同じ話題が持続的に盛り上がるそうです。

最期にAKB総選挙の予想について。
固定表と浮動票があり(どちらも票と言ってますが、書き込み数です)中間速報後の書き込み数の減衰で、だいたい結果が予測できるそうです。中間発表後、まゆゆはすぐ消えたので、その時点で成績が振るわないのが確定だったそうです。
さしこは優子ツートップな感じで減衰率が低かったです。
噂など、間接コミュニケーションが浮動票に効くそうです。

個人的には、AKB選挙は改ざんとか操作とかアリアリのマーケティング的なものかと思ってましたが、票に関しては弄ってないのに驚きました。
でも、逆に言うと書き込み数を増やすように働きかければ自然と順位を操作することができるということですね。



先生がつかってらっしゃるツール
商用的サービスから アール フォートラン
口コミ係長 ホットリンク
 
先生の記事がありました! 同じような話もあるので、こちらをみると分かりやすいかと思います!


当日様子がtogetterにまとまっています。
ニコニコ学会β 第3回データ研究会 まとめ - Togetter
http://togetter.com/li/588735

当日の生放送はこちらから。視聴期限は1週間です。
http://live.nicovideo.jp/watch/lv158628405

次回は、筑波大学図書館メディアの先生、学生さんの発表と、データGEEKな方の濃いい発表をレポートします!是非見てね!

---
ブログランキング参加中です! ぜひぽちっとお願いします


0 件のコメント:

コメントを投稿