DEIM 2016で「ソーシャルコメントからの音楽動画印象推定手法の提案」という研究の発表をしてきました!(土屋)

投稿者: | 2016年3月6日

寒さもゆるんできたようで、少しづつ春の訪れを感じさせる今日この頃、みなさまいかがお過ごしでしょうか。
ポカポカ陽気の中散歩に行きたい中村研究室B3の土屋駿貴です。

2016年2月29~3月2日にかけて福岡県福岡市はヒルトン福岡シーホーク「DEIM 2016 第8回データ工学と情報マネジメントに関するフォーラム」に中村先生、大野、白鳥、田島、前島と参加し、研究発表してきましたのでその報告をさせていただきます。全体の参加報告は別の記事にて報告させていただきます。

IMG_20160229_125341


[発表内容]

今回の研究は、前回「第96回グループウェアとネットワークサービス研究会」にて発表させていただいた内容を発展させた研究になります。そちらの研究に関しては、前回の発表報告(こちら)をご覧ください。

前回同様、YouTubeやニコニコ動画などの動画サイトでみられる「音楽動画」を見た際に受ける印象というものをニコニコ動画のコメント機能を用いて推定するといったものになっています。

ただ、今回は前回とは少し異なり、人手で作った主観印象評価データセットのサイズを拡張するために、人の印象が表出されているニコニコ動画のコメントを使っていくという話になっています。

実験方法は、人手で構築された印象評価データセットのある一定以上の印象評価値を持つ音楽動画をどれだけうまく分類できるかをコメントから生成した動画に対する単語ベクトルを用いてSVMで検証を行うというものになっています。

前回は単語ベクトル生成の際に全ての品詞を用いる手法(All手法)と形容詞のみを用いる(Adj手法)の2種類で実験を行いました。

今回の実験では、形容詞を使用して印象によって推定精度の差が出たことから他の品詞を用いることで印象によっては推定精度も上がるのではないかと考え、品詞を使い分けることで単語ベクトルを生成し実験を行いました。

その詳しい内容や結果は下に論文(後日リンクを貼ります)と発表スライドを載せておきますのでご覧ください。

この研究でわかったことを簡単にまとめますと

  • 手法を使い分けることで印象ごとに推定精度に差が出る
    • C1(堂々)、C6(かわいい)、Arousalといった印象は精度が高い
    • C3(切ない)、C5(滑稽)といった印象はどの手法を用いてもあまり精度が良くない
  • 印象を表す際には形容詞が用いられ、その形容詞に特徴が出やすい
  • コメントは映像に対して付与されやすい

となります。

[論文]

「土屋駿貴,大野直紀,中村聡史,山本岳洋:ソーシャルコメントからの音楽動画印象推定手法の提案」
最終原稿が3月下旬に公開される予定ですので少々お待ち下さい。

[発表スライド]


[感想]

今回は2度目の発表ということで緊張はほとんどしておりませんでしたが、実際に発表している最中は噛んでしまったり、発表時間をオーバーしてしまったりとミスが多かったので、今後気をつけて行きたいと思います。しかし、前回より発表を聞いてくださる方々の事を見ながら発表でき、そうすると頷きながら聞いて頂けてるのが確認でき、理解してもらえているのだと嬉しく感じました。これからも、色々な場所で発表していき経験を積んでいきたいと思います。写真は発表中の様子です。

DSC00157
DEIM 2016はとても規模が大きくとても圧倒されました。会場であるホテルもとても豪華でしたし、ご飯もおいしいし、部屋もきれいで最高でした!
会場のすぐ近くに海があり、発表が終わったと5人で行き少し遊んできました。1枚目の写真は海側から撮った会場近くの夜景です。

また、最終日の夜には中村先生オススメの水炊き(2枚目の写真)をいただきました。すごく美味しく、お酒も進みました!

thumb_IMG_1582_1024

thumb_IMG_1669_1024

非常に充実した3日間を過ごす事ができました。中村先生ありがとうございました!!