人間の音声には、興味深い特徴が沢山あります。
その一つが、声帯振動周波数の微妙な「ゆらぎ」です。
例えば、「あ−−−−」と伸ばして発音してみたとします。どんなに優れた歌い手の人がやっても、
決して声の高さが一定になることはなく、発音している間、わずかな「ゆらぎ」が見られます。
この「ゆらぎ」は人間の音声において、とても重要な役割を果たしているのです。
「ゆらぎ」を取り除いて、正確に全ての周期を同一にしてしまうと、とても人間の声とは思えない、
まるでブザーのような音になってしまうのです(図1)。
図1:母音[a]から基本周波数の「ゆらぎ」を取り除いたもの
ところで、この「ゆらぎ」はどのような特徴を持っていると思いますか?
実際に観測してみると、この「ゆらぎ」には周期性は全く見られません。
それならば、ランダムな「ゆらぎ」を付加すれば良いのではと思うかもしれません。
ところが、そのようにして合成音声を作成してみると、
とても人間の声とは思えない雑音まじりのものになってしまいます。
実は、この「ゆらぎ」は「カオス」的な特徴を持っていることが知られています。
「カオス」は数学のとても重要な概念の一つですが、自然界において頻繁に見られる現象であり、
人間の音声においても同様です。実際、この「カオス的ゆらぎ」を与えることで、
合成された音声の自然性がとても高くなり人間の声により近くなるのです。
私は、この「カオス」を音声合成ソフトウエアに組み込み、
いかに人間の音声に近いもの合成するかの研究を行っています。
(英語英米文学科 平坂文男)