サンプルを聴いてみるとかなりスゴイ技術のような印象だ。
これを聞いた人の何人に一人が合成音声だとわかるだろうか。しかも、「入力:人手による調整がされていないベタ打ちの歌詞付き楽譜」な所が驚きではある。聴いてみると、ブレスの音や、音声以外の音も入っていて、それがよりリアル感を醸し出しているが、そのあたりも楽譜から読み取っているのだろうか。ブレス記号はともかく、人間特有の音(雑音とも言えるかも)は、何かしらの学習結果として入るように思える。後、ビブラートも入っているのは楽譜に指示があるのだろうか、それとも自動的に付加しているのだろうか。
最近は、わざと人の声を合成音声風に変えたりする事もあるので、もはやどちらがどちらか判別するのは無理な気がする。今後の歌手は、学習用のデータを提供すれば、後は、自分で歌うこと無く、たくさんの曲を発表できるようになったりするのだろうか。なんかちょっとさびしいような。
逆にライブが尊重されるようになるかもしれない。レアな生歌声が聞けるとか。技術の進歩によって、この辺り色々価値観が変わるかもしれないな。