docomoの音声合成APIを利用して無料でVOICEROIDっぽい声を生成してみる

 · 15 min read

こんにちは。
とある案件で docomo の音声合成 API を利用することが合ったのですが、
エーアイ版の API のデモを試していたら「これゆかりんの声やんけ! と思ったら葵ちゃんもいる!」とテンションが上ってしまいました。
本来VOICEROID は有償(それも安くはないお値段)なのに、docomo の API を介せば無料で使えるというワクワク感。

もはや仕事なんてしている場合じゃない、理解を深めなければ。ということで試してみました。

まえおき

ボイロの話題に興味が湧いて来てくださった方が多いと信じて、ボイロ自体の説明は割愛します。
ボイロ自体の知識は持っているという前提で記事を書いています。あらかじめご了承下さい。

また、試して見た限りではすべてのボイロが扱えるわけではなく、

  • 結月ゆかり
  • 弦巻マキ
  • 月読アイ

の3名が使えることを確認できました。
残念ながら docomo の API だけでは全ボイロは試せませんでした。
特にエーアイ版 API を提供してらっしゃるAITalk のデモ版には葵ちゃんの声があるので、API で使えないのが残念です。
とても悔やまれますが、使いたければ買えという話なので仕方ない。

利用規約を確認してみる

ガイドラインを確認してみると、

  • 本 API を用いたアプリケーションは無償で提供すること
  • 本 API を用いたアプリケーション内で広告収入を含む収益行為をしないこと

の2つが条件で利用して良いとのことなので、売り物作るわけではないし実験する分には大丈夫だろうという判断です。

作ったもの

題材

今回の記事でお借りする台詞は、
個人的に好きな豚野郎さんの sm30193805の”ここテン”をお借りしました。

今回作る台本・プリセットで音声化したものが以下の音声ファイルです

Nodejs音声合成ffmpeg
© 2012-2021 Leko