あいみょんに「恋」とは何かと聞いてみると・・・
近年のAIブームに伴って、自然言語処理が話題になることが増えました。自然言語処理とは、私たち人間が日常的に使う言葉をコンピューターに処理をさせる技術のことを指します。今回のコラムでは、自然言語処理の代表的な解析手法である形態素解析を取り上げたいと思います。
まず、形態素とは、言語学の用語で、意味をもつ表現要素の最小単位となります。形態素解析は、以下の文章のように、意味のわかる最小単位に区切って、解析をしていく手法です。
文章解析やテキスト解析とも言い換えられます。この形態素解析の技術は私たちの身近なところで応用されています。Google Chrome、Microsoft Edgeなどの検索エンジン、最近ではAmazon AlexaやGoogle Nestなどのスマートスピーカーに使われています。ビジネス現場では、SNS分析ツールを活用した自社商品・サービスの評判分析、チャットボットを活用したホームページの問い合わせに対する自動応答サービスなどが挙げられます。
では、実際に形態素解析を行った結果をご紹介したいと思います。身近にあるテキストデータとしては、TwitterなどのSNSデータやインターネットニュース記事などがあると思いますが、今回は歌詞を使用しました。意外かもしれませんが、歌詞も立派なテキストデータであり、形態素解析の対象となります。歌詞を解析することで、歌手の深層心理のようなものが見えてくると面白いですね。歌手の選定にあたって、以下の2点の条件を設定しました。
① 楽曲の歌手=楽曲の作詞家であること
② データ量を確保するため、一定数の発表楽曲数があること
今回はあいみょんの楽曲を取り上げたいと思います。ご存じの方も多いかと思いますが、あいみょんは、「マリーゴールド」「今夜このまま」「ハルノヒ」「裸の心」などが代表曲で、2018年にNHK紅白歌合戦に出場するなど、現在大活躍をしているシンガーソングライターです。①の条件については、あいみょんがシンガーソングライターであることで合致します。また②の条件については、歌詞検索サービスサイトのUta-Netに掲載している発表済の楽曲が65曲と、十分なデータ量となっています。今回の解析では、こちらの65曲を対象としました。
まずは、どういった単語が多く使われているのか解析をしたいと思います。近年、SNSのトレンドワードランキングを目にする機会が増えましたが、膨大なデータから単語をカウントする際に、形態素解析が使われています。同様の手法で、あいみょんの歌詞で使われている単語の出現回数をランキングにしてみました。(注1)
「私」「僕」のような一人称、「君」「あなた」のような二人称の単語が多く使われています。8位の「好き」や9位の「恋」は多くのラブソングを歌っているあいみょんらしいですが、あまり特徴のないランキングとなりました。
次に、形態素解析を使って、歌詞データを深堀してみましょう。先ほどの出現回数ランキングで確認されたように、「恋」という単語は50回使用されていましたが、あいみょんにとって「恋」とは何でしょうか?歌詞の中で、「恋」はどのような表現をされているのでしょうか?ちなみに、デジタル大辞泉によると、恋とは「特定の人に強くひかれること。また、切ないまでに深く思いを寄せること。恋愛。」とあります。
あいみょんに直接質問をすることができないので、今回はあいみょんの歌詞の中から「恋」という単語と同じような意味で使われている単語を抽出しました。その際、文字そのままでは解析ができないので、その単語が持つ意味を表現できるよう、文字データを多次元の数値データに変換しています。そして、数字におきかえた単語同士の類似性をもとに、「恋」に近い意味で使われている単語をランキングにしました。
あいみょんにとっての「恋」とは「裸」のようです。かなり意外な結果となりましたが、解析上は、ヒット曲「裸の心」の歌詞の影響を大きく受けたようです。「裸の心」の曲中に出てくる「裸」を「恋」に置き換えても、おおむね意味が通じます。「踊る」「歌う」など楽しいイメージの単語が印象的ですね。また「寂しい」「つらい」「失う」などネガティブな単語も上位にランキングしていますが、こちらは恋本来の意味とほとんど同じ使われ方をしているように思われます。あいみょんの深層心理が理解できたとまではいかないものの、「恋」に対するイメージのようなものは理解できた(?)のではないでしょうか。
現在、あいみょんは26歳ですが、今後年齢を重ねるにつれ、歌詞の内容がどう変化をしていくのか、そして「恋」に対する考え方の変化があるのか興味は尽きません。もしかすると、10年後今回と同じ手法で解析すると、今回の解析結果と違った結果が得られるかもしれません。今回はあいみょんの歌詞解析を行いましたが、今後は他の歌手でも試してみたいです。
(注1)感嘆詞、助詞、助動詞は除く
(注2)コサイン類似度を用いて算出
(出所)歌詞検索サービスサイトのUta-Net(https://www.uta-net.com/)
(出所)広辞苑
(参考)Aidemy「西野カナに「恋」とは何か聞いてみた」(https://aidemy.net/magazine/690/)