Vocaloid は、人間に近づく必要はない。

以前「Vocaloidは、すでに人間に追いついた。」という記事を書きましたが、その後もVocaloid音声合成の新技術が出てきています。

先ず、2名の歌手の歌声を「声質」「歌い回し」に分離し、それらをリアルタイムで混ぜ合わせることができるv.morish というソフトが公開されました。

http://ist.ksc.kwansei.ac.jp/~katayose/v.morish/
http://gigazine.net/index.php?/news/comments/20080920_vmorish/

D



また、音774氏が、「ぼかりす」風調整法である「DOMINO調整法」を自身のブログで公開しました。

http://oto774.blog.shinobi.jp/Category/7/

D



さらに、「ぼかりす」動画もさらに公開されました。6月には鏡音リンの「Game of Love」が、9月にはVocaloid各種や「がくっぽいど」の「大漁船」が公開されました。

D


D



このように、人間に近い音声合成技術はますます進歩し、「DOMINO調整」のノウハウも公開されるなど、音声合成ソフトが人間の歌に近づく技術は着実に進歩しています。

しかし、興味深いのは、これらの技術は、Vocaloidユーザーから余り注目されていないことです。最初に「ぼかりす」や「ぼかんないんです」技術を用いた動画がニコニコ動画で公開されたときは、数十万のアクセス数を集めたのですが、6月に公開されたリンの「ぼかりす」動画はアクセス数約2万、9月に公開された「ぼかりす」各種動画はだいたい5000程度、「DOMINO調整法」を使った動画も多くはありませんし、v.morishの動画も18000程度のアクセス数しかありません。

このことは、Vocaloidの歌唱を人間の歌に近づける技術に対する関心を持つ人が、余り多くないことを示していると思います。

このことは、「ぼかりす」や「ぼかんないんです」技術が大きな注目を集めた後でも、Vocaloidの歌唱を人間に近づける試みが、ニコニコ動画でほとんど行われてこなかったことによっても裏付けられていると思います。

ニコニコ動画では、多くの人々の欲望をかき立てるような技術的課題があれば、多くの人々が課題解決に取り組み、極めて短期間で技術水準を飛躍的に向上させます。これは初期初音ミクMikuMikuDanceアイドルマスターの技術のインフレなどで何度も確認されたことです。

もし、多くのユーザーが人間のようにVocaloidを歌わせたい、または人間のようなVocaloid の歌を聴きたいと切望していれば、既に技術的には可能なわけですから、もっと人間に近い歌唱の動画が投稿され、人気を博していてもおかしくないでしょう。しかし、実際にはそうなっていません。

その代わりに、人間とは違うけれども、違和感無く聴くことができる、あるいは歌心のある調整は着実に進歩していると思います。現時点での到達点としては、kzさんによる「Last Night, Good Night」やジミーサムPによる「Adam」などが挙げられると思います。どちらもいかにも初音ミク独特の機械的な無機質感や拙さを残しながら、耳障りが良く、違和感なく聴けるような調整をしています。

また、「Last Night, Good Night」などは、どう聴いても初音ミクながら、ほとんど歌に感情がこもっているように聴こえるような盛り上がりのある歌になっています。このような歌唱は、人間ではありえないものであり、Vocaloid独自の歌だと言っても良いでしょう。


D


D



Vocaloidの歌唱がそのままでこれだけ受け入れられ、それが人間的な歌唱によって克服される技術的な通過点だと思われていないことは、日本では既に最低でも数十万人単位で、Vocaloidの歌声を、人間とは異なる独特の存在、キャラクター声として、違和感なく聴くことができ、なおかつその歌唱に独特の魅力を感じるリスナーがいることを示していると思います。

そのため、今後音声合成技術が進歩し、人間と変わらない歌唱をコンピューターに歌わせることができるようになっても、敢えて初音ミクを使い続ける人もいるでしょう。そして、数十年後に初音ミクリバイバルが起こり、リアルタイムでは初音ミクを知らない世代が、初音ミク的な歌唱を魅力的で新鮮に感じることもあるのだろうと思います。そして、その頃歳を取った私たちは、久しく耳にしなかった初音ミクの歌声を聴いて、ニコニコ動画での盛り上がりを思い出しながら、懐かしさを感じることもあるのでしょう。おそらく、初音ミクVocaloidは、既に人間の歌唱とは独立した魅力を持った、00年代の日本を代表するサウンドにまで成長したのではないかと思います。


もう一つ音声合成ソフト絡みで面白いのは、最近ニコニコ動画で棒歌ロイドが人気を博していることです。棒歌ロイドとは、Softtalkのような文章読み上げソフトに歌を歌わせるときに使われる呼び名です。読み上げソフト人気は、「ゆっくりしていってね!」で使われたことで火がついたようです。読み上げソフトは音程も全くないので、本当に単なる棒読みで歌にもなっていないのですが、その独特の間の抜けた感じが、「ゆっくり」の間の抜けたキャラクター性と合致したため、妙に面白く感じられるのでしょう。これなども、音声合成ソフトの不自然さ、拙さを逆手に取った表現だといえるでしょう。

D


D


ニコニコ動画の動きを見てみると、やはり音声合成ソフトは、単なる人間の代替物ではなく、独自の魅力を持つものとしてユーザーやリスナーに受け取られており、今後も、人間に近づく以外の表現が、色々と開発されていくのだろうと思います。音声合成技術は、既にほぼ上がりを迎えたポップミュージックの中では、今後発展していく数少ない領域の一つなので、今後どんな新しい表現が生まれていくのかワクワクしますね。



VOCALOID2 HATSUNE MIKU

VOCALOID2 HATSUNE MIKU