春の風が快い季節となりました.今年も花粉の季節がやってきてしまいましたね・・・
私は2016年2月29日から3月2日にかけて福岡県で行われたデータ工学と情報マネジメントに関するフォーラム(通称DEIM)に参加しました.その報告をさせていただきます.
[発表の概要]
今回の研究は、前回「第96回グループウェアとネットワークサービス研究会」にて発表させていただいた内容を発展させた研究になります。そちらの研究に関しては、前回の発表報告(こちら)をご覧ください。
発表した論文のタイトルは,「Twitterにおけるアニメのネタバレ防止手法の提案」というものです.タイトル通り前回と同様にTwitterでアニメのネタバレ防止することを目的としています.
私たちはこれまでの研究で,地域ごとにアニメの放送時間が異なるためにTwitterでネタバレを見てしまう視聴者がいるを問題とし,アニメにおける致命的なネタバレの調査,ネタバレデータセット構築,またネタバレツイートの判定手法の提案などを行ってきました.
しかし,これまでの研究で構築したデータセットがあまり実用的でない可能性があることやネタバレツイートを判定する有効な手法が見つかっていないという問題がありました.
[前回との違い]
本研究では評価者を集めて収集したアニメ番組に連動したツイートをネタバレかそうでないか分類してもらうことでより実用的なネタバレデータセットを構築し,また,ネタバレツイートの判定に有効なツイートに対する事前処理法と単語ベクトル生成手法を増やす,といったことを行いました.具体的な内容は以下の通りです.
・データセット
アニメ作品では特有な語が多様されること,またジャンルごとにネタバレとなる出来事が異なるという問題に対応するために,「同一作品データセット」と「ジャンル分けデータセット」というの2つのデータセットを構築しました.
・事前処理法
前回の正規化手法と人物名一般化手法で行った処理を同時に行う「正規化・人物名一般化手法」を追加しました.
・単語ベクトル生成手法
前回は形態素解析のみを行っていましたが,本研究では「係り受け解析」で単語ベクトルを生成する手法を追加しました.これにより,「誰が何をやったのか」といった文節同士の修飾関係も考慮可能になりました.
係り受け解析による単語ベクトル生成手順
[本研究の貢献まとめ]
- Twitterのネタバレ判定には登場人物名を一般的な名詞に置換し,かつ係り受け解析を用いて単語ベクトルを生成することが必須であることを明らかにしました.
- 同一作品内で学習した場合のネタバレ判定はしやすいが,急展開後や1話目の判定が困難であることを明らかにしました.
- バトル系アニメのネタバレ判定はしやすいが,ミステリー系アニメのネタバレ判定はしにくいことを明らかにしました.
[発表スライド]
[論文]
「田島一樹, 中村聡史:Twitterにおけるアニメのネタバレ判定手法の提案」は最終原稿が3月下旬に公開される予定ですので少々お待ち下さい。
[発表を終えて]
この発表で学生プレゼンテーション賞をいただきました!初めての受賞なので一生の思い出になると思います!発表練習や評価実験に協力してくれたみなさんに感謝しております・・・
DEIMに行ったメンバーと発表や懇親会など貴重な経験をしてきました!
前回発表を行ったグループェアとネットワークサービス研究会と比べると大規模な会場だったので,発表はかなり緊張しましたが何とか乗り越えてさらに成長できたと思います.今回の発表での反省を生かして次回はさらに分かりやすい発表になるよう心がけていきたいです!