Audacityで歌声wavと伴走wavをタイミングを合わせて結合する – スクリーンリーダーでボーカロイド曲作りにチャレンジ

私は視覚障害者(全盲)でパソコンをNVDAというパソコンの画面を音声で読み上げるソフト(スクリーンリーダー)を使って操作しています。

最近、このスクリーンリーダーNVDAを使ってボーカロイドの曲を作りたいと思い、google検索しながら試しているところです。
少しずつ使い方がわかってきて、このくらいのものを作ることができるようになりました。

これを作った流れを下記に記します。

使用したもの

ソフト 目的
Windowsのメモ帳 midiや歌詞の作成
テキスト音楽さくら UTAUで.vsqファイルを作るためにメロディのmidiを作る
UTAU midiファイルを.vsqファイルに変換する
VOCALOID3 Tiny Editor(歌声はMegPoid English) .vsqファイル読み込み、歌詞入力、歌声の調整、wav出力
Band-in-a-Box 伴走の作成
Audacity 歌声wavと伴走wavの結合

Band-in-a-boxでの伴走の作成

VOCALOID3エディターで作成できるのは歌声の部分だけなので、伴走部分を何かで作らなければなりません。

通常はCubaseで作るようですが、これを視覚障害者がスクリーンリーダーで操作するのは難しそうです。

そこで視覚障害者にも使えるmidi作成ソフトで伴走のデータを作ります。

テキストファイルをmidiに変換するソフトで作る方法では、「MUSE」や「mml2mid」、「テキスト音楽さくら」が使えます。

ループを組み合わせる形のGarageBandやiKaossilatorなどもMac OSやiOSのスクリーンリーダーVoiceOverである程度操作できるようです。

またmidi機器や専用のソフト、Pro Toolsなどを使って本格的なmidi編集もある程度可能なようです。特にmidiキーボードを直接演奏して録音する方が文字で音符を入力するより簡単かもしれません。

私は「Band-in-a-Box」という市販のソフトを使いました。基本版でも13,500円で、安いものではありませんが、コードを入力してアレンジの音楽ジャンル・スタイルを設定するだけで、簡単に伴走を作成できます。

スクリーンリーダーNVDAでも、このコード入力とスタイルの選択の基本的な操作は可能です。

スクリーンリーダーJAWSにはBand-in-a-Box用のスクリプトがあり、カーソル移動したときに入力されているコード名や小節の位置を読み上げるようですが、NVDAではこの読み上げはできません。

入力されたコードは、Shift+エンターキーを押して音で確認することができます。入力している位置はNVDAの画面レビューで確認できます。

作成したデータはmidiまたはwavファイルで出力することができます。

「テキスト音楽さくら」と「UTAU」での.vsqファイルの作成

VOCALOID3エディターだけで歌声を作成するのは、スクリーンリーダー使用者にはあまり便利ではありません。「MML Input」というJob Plugin(追加機能)を使用すると音符をマウスでクリックする代わりに、「c4 d8 e8」のように文字で入力も可能ですが、別のソフトでmidiを作って読み込む方が楽なように思います。

VOCALOIDエディターには「VOCALOID3 Editor」というフルのソフトと、「VOCALOID3 Tiny Editor」という歌声ライブラリー付属の機能制限版があります。

フルのエディターを使う場合は直接midiファイルを読み込むことができます。

Tiny Editorの場合はmidiを直接読み込めないので、「UTAU」というソフトでmidiを読み込んで、Tiny Editorで読み込める.vsq(VOCALOID2のファイル形式)に変換する必要があります。

midiの作成方法はいくつかありますが、「テキスト音楽さくら」では、メロディーを「ソミミー ふぁれれー」と書いてmidiを作成できるので、音声の読み上げを聞きながら作業するには、わかりやすくて便利です。

VOCALOID3 Tiny Editorでの歌詞入力、歌声の調整

UTAUでmidiファイルを変換した.vsqファイルをTiny Editorで開きます。

Altキーのメニューを選んで設定できるものがいくつかあります。

●「設定」メニューの「Preference」、「パートの歌唱スタイル」、「アクティブシンガープロパティ」の設定ができます。

NVDAの画面レビューモードとキーボードでのマウス操作をしないと設定できないものがあります。

●歌声ライブラリーの変更には、NVDAを画面レビューモードにして、歌声ライブラリー名(たとえばMewなど)のところで右クリックして出てくるメニューから行います。

●歌詞入力、発音記号の変更、ビブラートなどの設定をするためには、まず画面上の音符を選択しなければなりません。NVDAの画面レビューモードとキーボードでのマウス操作で行うのですが、確実な方法がわかりません。あちこちクリックしていると歌詞入力できる状態になります。

音符が選択されている状態では次のキーボード操作ができます。

  • F2で歌詞の編集モードに入る
  • TabとShiftキーで次の音符・前の音符へ移動
  • Altキー+下または上カーソルで歌詞入力と発音記号入力の切り替え
  • Altメニューの「音符のプロパティ」を開きNVDAの画面レビューで「Vibrato」や「Exp」の設定を開く
  • Altメニューの「歌詞の流し込み」
  • Altメニューの「発音記号変換」(英語の歌詞を入力したときに行う)

歌詞の入力、ジェンダーファクターやアクセント、ビブラート、ベンドなどを設定してwavファイルで書きだします。

Audacityでの歌声と伴走の結合

Audacityを起動して、「開く」メニューから伴走のwavファイルを開きます。トラック1に設定されます。

次に「開く」メニューではなく、「取り込み」メニューから歌声のwavを開きます。トラック2に設定されます。上下のカーソルキーでトラック1とトラック2の選択を切り替えられます。

●Audacityのキーボードコマンド:

  • Shift+aキーでカーソル位置を移動しながら再生と一時停止
  • スペースキーでは同じく、再生・一時停止だが、カーソル位置は移動しない。たとえば曲の先頭でスペースキーを押して再生して、もう一度押して停止してもカーソル位置は先頭のまま。
  • Shiftキーを押しながら左右カーソル、ホームキー・エンドキーで範囲選択できる。たとえばカーソル位置が曲の途中にあって、Shiftキー+ホームキーとすると、カーソル位置から先頭までの範囲選択。
  • [と]、大かっこを入力すると数字で選択開始・終了位置を設定できる

私の環境で、Band-in-a-Boxの伴走とVOCALOIDの歌のwavを重ねると、歌と伴走のタイミングが合っていないので、歌のトラックに無音を挿入することで調節しました。

上下カーソルキーで歌のトラックに合わせて、Altメニューの「ジェネレーター」の「無音」メニューを選択して、秒・ミリ秒の数字を設定して、音を再生して確認、無音を増やしたり減らしたりを繰り返して合わせました。

もっといい方法があるのではないかと思うのですが、わかりません。1小節ずらすとかそういった単位ではないようです。500ミリ秒ずらすとかそのくらいの調整です。

midiのレイテンシーやVOCALOID Editorの設定で可能なのでしょうか。

参考

関連投稿