十三期生 / 研究活動 / 藤川雄翔

Posted on 2023-11-26
第10回コミック工学研究会で発表しました(M1藤川)


皆さん,こんにちは!M1の藤川です.いよいよ本格的に朝と夜が寒くなり始めてお布団が僕を離してくれない季節になってきました(笑).

さて,今回は2023年11月18日(土)に,東京大学本郷キャンパスで開催されました第10回コミック工学研究会で「物語作品の短文要約によるストーリーの特徴分析」というタイトルで発表致しましたのでその報告をさせていただきます.

発表内容

タイトル: 物語作品の短文要約によるストーリーの特徴分析

著者: ⚪︎藤川 雄翔,松下 光範,山西 良典

 私たちは漫画や小説,テレビドラマなど様々なメディアで多くの物語作品に触れ,鑑賞しています.それらの物語作品は短く端的に要約することができ,コンセプトとして表現することができます.例えば,私たちに馴染みの深い『桃太郎』だと「主人公が仲間を集めて,仲間たちと共に人々の平和を脅かす存在を打ち破る物語」という風に表現できます.こういったコンセプトは制作者にとってはストーリーを作る際の土台となるアイディアとなり,読者,視聴者にとっては,家族や友人などの他人にその物語作品を推薦するための簡単な説明として用いることができます.

 本研究はストーリーのコンセプトに基づいた物語作品への情報アクセスを目的としています.現在のWebサイトや漫画アプリでは,ジャンルや著者などの書誌情報を用いて物語作品の検索をしています.しかし,書誌情報だけでは物語作品のストーリーの内容にまで踏み込んだ検索はできません.例えば,「主人公が物語の序盤から強くて対峙する敵を次々と打ち破っていく」物語作品Aと「最弱の主人公が最強の師匠に弟子入りすることで成長し最強になっていく」物語作品Bがあったときに,これらの物語作品はストーリーの内容が異なりますが,同じアクション・バトルジャンルに分類されてしまいます.同じジャンルでも物語作品Aのようなストーリーを読みたい読者もいれば,物語作品Bのようなストーリーを読みたい読者もいます.つまり,好きなストーリーの物語作品を読もうとすると現状の検索手法では多くの物語作品から探索を行わないといけないため,時間と労力がかかる困難なものとなっています.そこで本研究では物語作品を短く端的に言い表すことのできるコンセプトに着目しました.コンセプトが類似した物語作品はストーリーも類似するのではと仮説を立てたわけです.

 ストーリーのコンセプトに基づいた物語作品への情報アクセスを実現するためには,個々の物語作品に対するストーリーのコンセプトが記述された文章(以下,コンセプト文)が必要になります.しかし,ストーリーのコンセプトはストーリーの見どころを伝えるハイライトやストーリーの流れを示すダイジェストとは異なり,エンタテインメント性が低く,コンセプト文のリソースが少ないです.

 そこで,関西大学総合情報学部に在籍している学部生にアンケートという形で自身の好きな物語作品を他者に推薦するという状況を想定し,その物語作品を要約した短文を作成してもらいました.このとき,(1)140文字以内で要約すること,(2)文の末尾を「〜物語」で締めくくること,(3)その物語作品のキャラクタの名前や組織の名前といった固有名詞を使わないこと,という3つの条件を課しました.その結果,287件の短文を収集することができました.

 しかし,ここで今回収集した物語作品を要約した短文は果たしてコンセプト文になり得るのかという疑問がでてきます.と言うのも,その物語作品に対する捉え方が回答者によってバラバラになってしまう場合があるからです.そこで,今回の研究では,「物語作品を端的に要約した短文はコンセプト文として利用可能か?」について検証することにしました.具体的には,収集した短文のそれぞれの文章ベクトルを算出し,同一物語作品で類似した文章ベクトルが得られるのかについて検証を行いました.分析の対象とした短文は,同一の物語作品について3件以上収集できた19作品の物語作品の短文,計97件です.

 今回,文章ベクトルは,形態素解析器であるMeCabで短文の形態素解析を行い,Word2Vecを用いて短文に含まれる単語の200次元の分散表現ベクトルを取得し,1つの短文に含まれる全単語の分散表現ベクトルの平均を文章ベクトルとして算出しました.


こちらは得られた200次元の文章ベクトルを散布図として2次元にプロットした図になります.

 この図から,3種類の物語作品の短文群,(1)異なる物語作品の短文群であるA群,(2)同一物語作品の短文群であるB群,(3)同一物語作品でありながら短文群が二つに分かれたC群,が確認できました.まずA群についてですが,A群に含まれた短文はそれぞれが属する物語作品群から外れていた短文でした.A群に含まれたそれぞれの短文のcos類似度は,0.30〜0.70とそこまで類似度が高くないことが確認できました.これらのことから,A群は200次元上では遠い位置にあったベクトルが2次元に圧縮したことにより,たまたま近くにプロットされているように見えてしまった群であると考察することができます.次にB群については,それぞれの短文に共通した単語やキャラクタの目的に関する記述が含まれていることが確認されました.このことから,物語作品の特定の1側面が記述されることで,同一物語作品の短文が集合し,群を形成すると考察できます.つまり,物語作品の短文要約はコンセプトとして利用可能であることが示唆されました.最後にC群については,B群と同様に単語やキャラクタの目的が共通して記述されていましたが,そのキャラクタの目的を達成するための行動が異なって記述されていることが確認できました.このことから,同一物語作品でも複数の側面から物語作品が評価されることがあり,二つの異なる見解が記述されることにより二つに分かれると考察できます.しかし,二分した短文群はそれぞれで類似した文章ベクトルが得られていることから,二分した場合でも物語作品の短文要約はコンセプトとして利用可能であることが示唆されました.

 以上今回説明した詳しい研究内容は下記の発表スライドと論文情報に記述されていますので,ぜひご覧ください.

発表スライド:  
TaketoFujikawa_10thComicComputing2023 from Matsushita Laboratory

論文情報

藤川 雄翔, 松下 光範, 山西 良典. 物語作品の短文要約によるストーリーの特徴分析, 電子情報通信学会第10回コミック工学研究会, pp.34-36, 2023.  

感想

 3度目の学会発表ということもあり,もうさすがに発表は慣れてきたかなと思いきやそんなこともなく…やっぱり,発表する前は緊張しますね.何度人の字を手に書いたことか…(笑) 今回はこれからやっていく研究の第一歩として発表させていただきましたが,やはり課題は多く様々なご指摘をいただきました.この場でいただいたご指摘を次に活かし,より良い研究活動にするようこれからも精進したいと思います!

 余談ですが,コミック工学研究会では恒例の発表の前に好きな漫画を紹介するコーナーがあるのですが,1ヶ月に30作品以上読んでいる僕には好きな漫画や紹介したい漫画が多すぎて1つに決めるのが大変でした^^; また,コミック工学研究会に参加した次の日は日曜日ということだったので,帰る前に東京を1日中ぶらぶらと散策していました!東京にはこれまでにも何度か来ているのですが,意外と浅草に足を運んだことがなかったので,まず浅草寺を訪れ参拝し,その後秋葉原にも行ってみました!電車を使わずにずっと徒歩で移動していたのですが,天気がよく徒歩ならではの東京の新たな発見があったりと楽しく移動でき,全然疲れは感じませんでした!
 
(プライバシー保護の観点から,人物が写っている箇所にはモザイクをかけています)

(文責:M1藤川)
Posted in 十三期生, 研究活動, 藤川雄翔 | Comments Closed

Related Posts