くろぐ

動画のことをかく

【MYCOEIROINK】勢いで合成音声を8キャラクター作ってみた感想

【はじめに】

CoeFontだけでなく、TALQuやCOEIROINKなど
ここ2、3年で自分で合成音声を作成し、
配布したり、ほかの方に使用してもらえたりする状況になってきました。

UTAU化に挫折した経験のある私としては
「えっ、文章読み上げればできるんですか!?(要編集・学習)」
ということでCOEIROINK向けにいっぱい作った結果、
キャラクターとしては8人(個別に割り振るの面倒くさかったので名前は一緒)
現時点で12スタイルほどあります。
※なぜCOEIROINKを選択したのかは2022-10-13の記事参照

【8キャラクター作ってみた感想を簡潔に書くと】

・単純に多くて管理しきれない
・スタイル追加が五月雨式になる
・前録音したときのキャラの声が思い出せない

端的にいうと
_人人人人人人人人人_
> おすすめしない <
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^ ̄

【詳しく書くと】

・単純に多くて管理しきれない

もともとキャラクターとしてのイメージがないところ、
今ようやくバストアップのイラストを追加していっている状態で
現在5/8が終わりました。

キャラ数として多いと1キャラクターに
かけられる時間が少なくなってしまうのでおすすめできません。

8人いるうちの何人か優先的にスタイルや立ち絵を追加するのも手ですが
合成音声「木下にび」の最終の利用用途を考えるとそれができないので
自分で首を絞めていくスタイルです。

・スタイル追加が五月雨式になる

スタイル追加をローテーションさせているので
1キャラクターあたりスタイル追加が
3か月程度かかっています。

1キャラクター向けに3スタイルほどまとめて追加しようとすると
ITAコーパス+MANAコーパスフル録音と、
GoogleColabでの学習をお金出して早めたとしても
頑張って1スタイル追加に1週間~2週間はかかるので、
後回しになったキャラクターのスタイル追加がえらく遅れるという。

「5スタイル新たに追加しました!」という告知もしにくいです。
なんせ別々のキャラクターだし……。

・前録音したときのキャラの声が思い出せない

どんな声も一定で出すことができればよいのですが、
プロでもないのでだいたい前回収録時の声が思い出せなかったり、
声が変わっていたりします。

そのためコーパス文を録音し、学習までまわしてみて
「通常バージョンと比べると声が違うやん」とやり直し、
ということを何回かすることになります。実際何回かしてます。

とくにITAコーパス+MANAコーパス全部収録後、
時間と場合によってはお金もかかるGoogleColab上での
学習をある程度進めた状態でこうなると泣くことになります。

声として安定感があるだけでなく、
キャラ毎に声の使い分けしているプロはすごいですわ。

【個人で管理できる限界だと思われるキャラクター数】

「とりあえずスタイルは後で追加するかも
 しれないけど作ってみよう、立ち絵も用意しておくかな」
であれば5キャラ

「気合を入れてキャラクターを作成した、
 これから順次スタイルを追加していく予定」
というのであれば3キャラクターぐらいが限界じゃないかなって気はします。

とはいえ「うちの合成音声8人いるんですよ~」といったら
だいたい初見の人は驚くので一発ネタとしては秀逸だと思います。
ずいぶん手間のかかる一発ネタですね。

【8人いる自合成音声 木下にびについて】

そんな自合成音声である木下にびですが、
「8人もいるとかどんな音声だよ」と興味がありましたら
下記のサイトからサンプル視聴できます。

sites.google.com

COEIROINKの製作者であるシロワニさんが
何故かWebサイト上にユーザー追加音源までまとめてくださっているため、
こちらでも視聴できます。

coeiroink.com

 

8キャラクターもいる一番の問題はシロワニさんの
リソースをくっていることな気がします。
ニコニコ大百科などでCOEIROINKの記事をたまに編集しているので許してほしい。