MainStage: ボコーダーの基礎

ボコーダーの基礎

ボコーダー(Vocoder)とは「VOice enCODER」の略語です。ボコーダーは、分析入力部で受け取ったオーディオ信号の音響特性を分析し、それをシンセサイザーのサウンドジェネレータに送ります。その処理結果が、ボコーダーの出力として発音されます。

旧式のボコーダーでは、分析信号として人間の話し声、合成信号としてシンセサイザー音を使っていました。1970年代後半から1980年代初頭にかけて、この音が広く知られるようになりました。ローリー・アンダーソンの「O Superman」、リップスの「Funkytown」、さらにクラフトワークの「Autobahn」や「Europe Endless」、「The Robots」、「Computer World」などにもボコーダーが使われています。

このような「歌うロボット」としての使いかたばかりではなく、ボコーダーサウンドは映画にも数多く取り入れられています。「宇宙空母ギャラクティカ」のサイロン兵や、さらに有名なものとしては「スター・ウォーズ」に出てくるダース・ベイダーの声もそうです。ボコーダーの歴史を参照してください。

ボコーダーの処理そのものは、人の声以外の音を材料にしてもかまいません。たとえばドラムループを分析信号として使い、合成入力に与えられた弦楽合奏の音を変形させる、ということも可能です。

ボコーダーによる音声の「分析」あるいは「合成」機能は、2組のバンドパスのフィルタバンクによって実行されます。バンドパスフィルタには、1つの周波数帯域(周波数スペクトル全体のうちの1スライス)をそのまま通す働きがあります。それ以外の周波数成分は遮断されます。

EVOC 20プラグインでは、この2組のフィルタバンクを「分析バンク」および「合成バンク」と呼んでいます。それぞれに並べるフィルタの数は同じにします。すなわち、たとえば分析セクションフィルタバンクを1-5番の5つのフィルタで構成するならば、合成セクションのフィルタバンクにも同じ5つのフィルタを用意します。分析セクションのバンクの1番帯域は合成セクションのバンクの1番帯域に対応し、2番、3番なども同様です。

分析セクションに入力されたオーディオ信号は、分析フィルタバンクで帯域に分割されます。

周波数帯域ごとにエンベロープフォロワーがついています。各帯域のエンベロープフォロワーは、オーディオソース(具体的には関連バンドパスフィルタを通ったオーディオ信号)の音量変化を追跡(追随)し、動的に制御信号を生成します。

この制御信号を合成フィルタバンクに送り、対応する帯域の信号レベルを、アナログボコーダーのVCA(Voltage Controlled Amplifier: 電圧制御アンプ)で調整します。分析フィルタバンク内の帯域の音量変化は、合成フィルタバンク内の各帯域に反映されます。このようなフィルタレベル変更は、元の入力信号の合成再現、または2つのフィルタバンク信号の混合として聞こえます。

図。ボコーダーの信号経路構成図。

ボコーダーがこの分割帯域数を多くするほど、分析信号の音声特性を忠実に反映した信号が合成フィルタバンクで再生成されます。EVOC 20 PolySynthでは、バンクあたりの帯域数は最大20です。EVOC 20 PolySynth信号パスの詳細については、EVOC 20構成図を参照してください。

公開日: 2019/09/06
役に立ちましたか?