中村研究室M2の白鳥裕士です。
3月4日〜6日に長崎県佐世保市ハウステンボスで開催された第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)にて、「ネタバレ判定可能なスポーツとは?」というタイトルで研究発表をしましたので、その報告をさせていただきます。
研究概要
今回発表した内容は,これまでに国内発表してきた内容(SIGGN96, DEIM2016など)や,国際発表してきた内容(CollabTech2018)で検証しきれなかった部分を補完するものになっています.
まず,これまでの発表内容を改めて振り返りますと,ネタバレに関するデータセット(サッカーの試合に対するTwitter上の投稿を収集し,その投稿をネタバレであるか否かに分類したデータの集合)を構築し,そのデータを用いて,「Twitter上に現れるサッカーのネタバレコメントはどのような文章特徴をもっているのか?」の分析,および「Twitter上に現れるサッカーのネタバレコメントを機械的に高精度に判定するにはどうすれば良いのか?」の実験を行ってきました.その結果,
- Twitter上のスポーツのネタバレは,単語自体にネタバレっぽい特性があり,試合展開(勝っているor負けている)によってネタバレ内容が異なる
- 試合展開を考慮して(試合展開別にネタバレの特徴を機械に学習&判定させて)ネタバレを判定すると判定精度が高い
- より核心的なネタバレ(試合の最終結果がよりダイレクトに伝わってしまうもの)に焦点を当てて判定すると,80%以上の精度でネタバレが判定可能である
ということがわかっています.今回の発表内容は,サッカー以外のスポーツ(野球やバレーボール)で同様の分析や実験を行い,サッカー以外のスポーツでもネタバレを高精度に判定することは可能なのかや,スポーツごとに判定精度に違いはあるのかを検証したものになります.
その結果,
- 試合の勝敗状態を考慮することにより様々なスポーツでネタバレを高精度に判定可能
- 野球は判定し難く,バレーボールは判定し易い(精度:バレーボール>サッカー>野球)
- 実際に近い状況ではより高精度に判定可能
ということがわかりました.より詳細な内容につきましては,以下の論文および発表資料をご覧ください.
論文
発表資料
感想
発表については,いつもより少し前のめりな発表になってしまいましたが,議論は活発にできたので良かったかなと思います.
また,長崎に初上陸したので,ハウステンボスや佐世保バーガー,レモンステーキなどたっぷり楽しんできましたので写真を載っけておきます.
今回で学生最後の発表になってしまいましたが,振り返ってみると,こうして発表を繰り返していくうちに,研究者としての考え方や発表のコツ,研究の進め方など,成果を上手く出している方の良い部分を吸収していけていたんだなと感じました.
これをご覧いただいている方には,ぜひ自分の行っていることを外の場でどんどん発表してみることをおすすめします!
では,また会う日まで!