居直り DAW
時代は DAW ( Digital Audio Workstation )ということで、 MIDI 技術に限らず
システム構成とか作業内容、オーディオ周りのことについてとかを適当に書き綴るコーナーです。
私自身のメモという側面が強いですのでお役に立つかはわかりませんし、
情報が正確である保証もありません。わりとトンチキな事を書くのではないかと思われます。
したがって何食わぬ顔で内容を修正したりするかもしれませんし、
コーナー自体がなかったことになるかもしれませんが、その辺も含めて居直っていきます。
居直り 001 あの頃ノイズはひどかった
以前の私の環境はノイズがとかくひどかったのです。なんだかしらないけれど録音すると「チュワチュワチュワ……」という感じの音が
混入していました。録音ソースの入力レベルが大きければ誤魔化せたのですが、ハチプロの出力もそれほど大きくはないし
フェードアウトやパッド系音色のリリース音など音が減衰する局面ではやはりどうしても浮き上がってしまうので、かなり困ったものです。
結論から言うとこのノイズの原因はシリアル MIDI ケーブルだということが判明しました。このシリアル MIDI ケーブル、
一本で 32ch まで扱えるので便利といえば便利なのですが、 PC 本体からの電源ノイズをかなり伝えやすいようです。
だもんで、シーケンサを走らせると微妙に「ちゅいーぃ」と音がする、 PC のウインドウ操作に合わせてノイズが入るなどの
症状の出ている方は、まずシリアル MIDI ケーブルを疑ってみるのがいいかもしれません。
また、未確認情報ではありますが、最近の音源で採用されてる PC との USB による直接の接続も
電源ノイズが伝わりやすいようです。
追記: USB を引っこ抜いたらノイズが消えた、というご報告をいただきました。やはり USB による直接接続はノイズになるようです。
○
その他よくあるノイズ対策
・音源から PC までの配線をできるだけシンプルに組む
基本といえば基本です。バランスケーブルならともかく、一般の DTM 音源で使えるケーブルは RCA なので、
配線が長くなるほど外部の電磁波などの影響でノイズが乗りやすくなります。
・オーディオカードの IRQ を独立させる(特に AGP との共有は危険)
オーディオカードが使用している IRQ が他のデバイスと共有されているとノイズが乗りやすいということがあるようです。
可能ならば単独の IRQ をオーディオカードにあてがってあげるのがベターです。
なお、電源マネージメントシステムが ACPI で動いていたりすると IRQ を自動で纏め上げてしまうので、
手動で IRQ を変更する場合は APM に切り替える必要があります。
・ AD コンバートを PC の外部で行うオーディオカードがあればなお良し
言うに及ばず、ではありますが、入力ソースを電磁波の箱たる PC の内部で AD 変換するより、
外部ブレイクアウトボックスで AD 変換してデジタル情報のみ PC に取り込むほうが理想的というお話です。
その手のオーディオカードはそこそこ値段が張りますが、そのぶん性能には大概文句なしです。
居直り 002 ダイナミックレンジという概念
量子化ビット 24bit での録音というテーマについて考えたときに、思いのほか私の中で理解不足や勘違いがあったと
気付かされたのがダイナミックレンジのことについてでした。
「認識できる最大音量と最小音量の範囲」とまとめてしまうとそれで終わってしまうのですが、
そこに何となく「ダイナミックレンジが広いってことは繊細な音も聴き取れる、小さな音も拾える」
というイメージはないでしょうか。私はありました。また、「最大音量と最小音量」というのが
一曲の中の抑揚としての最大と最小だというイメージはないでしょうか。これも私はありました。
間違っていると言い切れない部分もありますが、これはあまり正確な認識ではありません。
言い訳をすれば、ダイナミックレンジに関する用語解説を見ても大概は「最大音量と最小音量の範囲」としか
書いてありませんし、もうちょっと詳しい記述を探しても「オーケストラのように広いダイナミックレンジを持つ……」とか
書いてあれば「ああ、確かにオーケストラって抑揚が大きくつけられているもんなぁ」と思い込んじゃうってものです。
いや、言い訳ですけどね、ホントに。でもオーディオ関係の知識が皆無だった私にとっては
どうにも捉えづらかった、誤認しやすかったということは確かです。
実際のダイナミックレンジの概念は「同時に鳴っている中で認識できる最大音量と最小音量の差、範囲」ということになります。
例えばダイナミックレンジが 96dB であるという場合、 A という音と B という音が同時に鳴っているとき、その音量差が 96dB
以内であれば認識できる、聞き分けることができるということです。
これはあくまで範囲のお話ですので、音量レベルメーターで測ってそれが 1 〜 97dB であっても
30 〜 126dB であってもその差が 96dB 以内であればいいというお話です
(当然ですが、あまり極小の音だと人間の耳にも聞こえませんし機械も取りこぼします。逆に大きすぎてもいけません。
あくまでも人の耳や機材にとって適正な範囲内での「認識できる、聞き分けられる範囲」ということです)。
どうやら一般に人間の耳のダイナミックレンジは 90dB 〜 120dB くらいあるようなのですが(この辺は資料によってまちまちです)、
実際のところはどこまで聞こえてるものなのでしょうか。
非常に胡散臭い手法
( * )で私の耳の性能を測ってみたのですが、
ダイナミックレンジはだいたい 60dB くらいでした。何か納得しました。
* 今回の測定方法
440Hz の正弦波とホワイトノイズを同時に再生し、ホワイトノイズの音量を次第に絞っていき、聞き取れなくなったときの音量差を測りました。
測りながら気付いた手法の穴をことごとく無視したことと安ヘッドホンでの挑戦ということで、データとして著しく信憑性を欠きます。
居直り 003 量子化ビット 24bit レコーディング
ダイナミックレンジの確認が済んだところで 24bit レコーディングの話に進みます。
実際のところ「 24bit でのレコーディングってどのくらい意味があるのか」というトピックが持ち上がるまで
私はあまり気にせず 16bit でレコーディングしていました。知識として 16bit より 24bit の方が
ダイナミックレンジが広い、音質が良いということは知っていましたが、
実際の音質の差を感じられなかったことと所詮ハチプロの出力を扱う上では大差ないだろうと
たかをくくっていたこともあり、またデータサイズの肥大化によるPCへの負荷増加も懸念して
16bit のままでいたのです。
そこで、直感するところで考えても埒があかないのでもう少し理詰めで考えてみようと思いあれこれ調べてみた結果、
24bit によるレコーディングのメリットが見えてきましたので、まとめます。
ここでテーマに上がっている量子化ビットというのは波形の振幅に関する解像度です。
アナログ波形をデジタルデータに変換する際にどうしても滑らかなアナログ波形と
カクカクしたデジタル波形の間に差が生じます。これを量子化誤差といいます。
デジタル録音時にこの量子化誤差の分が実は微細なノイズとして乗ってしまいます。
これを量子化ノイズといいます。
この量子化ノイズを極力抑えるためには量子化の解像度を上げることでアナログ波形との誤差を減らすしかありません。
量子化ビットが 16bit である場合最大 96dB のダイナミックレンジを 65,536 ( 2^16 )分割しているのに対し、
24bit の場合最大 144dB のダイナミックレンジを 16,777,216 ( 2^24 )分割することができます。
面倒くさいので割り算をして比べることはしませんが、 24bit の方がはるかに細かく分解していることがわかります。
量子化ノイズを考えたときに 24bit レコーディングはかなり有利であるといえます。
また、「 16bit である場合最大 96dB のダイナミックレンジ」「 24bit の場合最大 144dB のダイナミックレンジ」と
なんの断りもなく記述しましたが、量子化ビットが増えるということはダイナミックレンジが広がるということでもあります。
この辺の理屈や原理、実は私にはよく理解できなかったのですが、音圧 = 空気の振動ということを考えて
物理的に公式に当てはめるとそういう結果になるようですので、ここは鵜呑みにさせてもらって
16bit より 24bit の方がダイナミックレンジが広がるという解釈で済ませておこうと思います。
ちなみに 1bit あたり 6dB の増減になります。
ダイナミックレンジが広がるということは音のより細かいところまで録音でき、再現できるということです。
微小な音色の違い、プレイノイズや空間・空気感など本来聞こえるか聞こえないかというレベルでの微妙なニュアンスを含んだ
音の録音、再生、さらにはミキシングによる構築がより高い精度で行えるということです。
最終的に CD クオリティであるところの 16bit にダウンコンバートをするにしても、
原音にある繊細ニュアンスを EQ などを使ってダイナミックレンジ 96dB 範囲まで強調しておくこともできますので、
オーディオ素材の精度を高める、素材の利点を増やすという意味でおいても 24bit レコーディングは
有利なものであるといえます。
逆にダイナミックレンジが狭いとどうなるかを考えると 24bit の方がレコーディングの際に有利な点が
別の角度からわかりやすく浮き上がってきます。
ダイナミックレンジの広いソースから録音する際に録音機器側のダイナミックレンジが狭いと、
録音レベルをソースの最大音に合わせたときは最小音が拾えなくなり、逆に最小音に合わせると
最大音の方がレベルオーバーでクリップしてしまうわけです。
どちらも収めるためにはコンプレッサーやリミッターでレンジを圧縮する必要がありますが、
もちろんこれは原音に手を入れることになるので音が変わります。
できる限り原音に忠実に録音するならばダイナミックレンジは広いに越したことはないわけです。
さて、ここまできて「とはいえ 16bit でも 96dB のダイナミックレンジが確保できるわけでしょ。そんなに普通は要らないし」
とお思いかもしれません。私もそう思いました。ハチプロじゃ 96dB 差の音なんか出せなくはないでしょうが普通は出しませんし、
それを聞き分けるだけの耳も私にはなさそうです。ところがもう一歩踏み込むと話はまるで変わることになります。
実は量子化ビット数のうち実際に利用できる範囲というのは限られてきたりするようなのです。
私の手元に詳しいデータがあるわけではないので、あくまでも聞きかじりの知識ということになりますが、
まず前述の量子化誤差による量子化ノイズが数ビット占有してしまいます。これは占有というよりは
量子化ノイズの音量を利用できるダイナミックレンジの範囲内に数えこむことは実質的には考えられないので、
ノイズが乗っている範囲のダイナミックレンジは切り捨てると解釈した方がいいかもしれません。
せっかく最小音でいいニュアンスが出ているのにノイズに紛れていたら台無しになってしまうということです。
もう一点ヘッドルームによる制約も加わります。シーケンサや波形編集ソフト、デジタルオーディオ機器は
多少入力信号がレベルをオーバーしてもクリップしづらいように機器の最大音量レベルの上にある程度のマージンを持っています。
これをヘッドルームといいます。ミックス時にどう見てもクリップしているのに音が割れていないという現象は、
クリップして歪んだ音があまり違和感なくきれいなものであったのでなければ、
レベルオーバー分がこのヘッドルームに収まっているから起こっているといえます。
このヘッドルームのマージン、これはソフトや機器によってまちまちではあると思うのですが、 +6dB なら 1bit 、
+12dB なら 2bit 分はどこから出てきているかというと、オーディオデータの量子化ビットから持ってきていたりします。
そのため、常にクリップさせつつ音が歪まないギリギリのレベルを狙って録音、再生、ミキシングをしているのでなければ
(それもありといえばありかもしれませんが、音が歪まないギリギリの見極めや、結果としてのダイナミックレンジの総量の判断が
面倒になりますし、何のためのヘッドルームなのかわからなくなっちゃいます)、
このヘッドルーム分のビット数が作業中は量子化ビットから引かれ、結果としてダイナミックレンジが狭まることになるわけです。
以上の量子化ノイズ用の切捨てとヘッドルーム用のマージンをここでは仮に合計 5bit と仮定すると、
実際に利用できるダイナミックレンジは 16bit のケースでは 16bit - 5bit = 11bit = 66dB 、
24bit のケースでは 24bit - 5bit = 19bit = 114dB となります。
ずいぶんと格段な差が出てしまいました。ここではあくまでも実質的に利用できないビット数を
5bit と仮定してのお話ですので、結果も数値としては仮定の域を出ないものではありますが、
16bit レコーディングと 24bit レコーディングに大きな性能差がありそうだということは予想できると思います。
最後にマスター時のダウンコンバートについても少し触れておこうと思います。
24bit から 16bit に変換する際のプロセスがどういったものなのか、どういう理屈で行われているのか
結局わからなかったので実際にどこまでのものであるかはわかりませんが、一般的に 24bit と 16bit の差分 8bit は
下位ビットから引かれるようです。この下位 8bit には前述の量子化ノイズや
波形編集時に生じる演算の誤差が含まれていますので、そこをバッサリ斬り落とすことができます。
また、このときのディザリングによっては実際は 16bit でありながらも
それ以上のクオリティで仕上げることもできるようです。
というわけで、あくまで音を聞いてわからなかったから理詰めにしてみたということではありますが、
なんだか 24bit レコーディングの方がいいような気になってきました。
居直り 004 とにかく素材は 0dB で勝負だゴーについて
24bit のトピックが上がった際に「何でもかんでも 0dB に合わせて録るのってどうなのかしら」という
こともちらりと出てきました。
どの道フェーダーを絞って使うことになるわけですし(すぐクリップしますから)、
正直なところ私もそこまで神経質になる必要はないと思うのですが、ダイナミックレンジとノイズ対策という 2 つの観点から
0dB に合わせた録音のメリットを上げてみることができます。
まずソースのダイナミックレンジが極めて広い場合は、最小音まで拾いきるにはどうしても最大音を
引き上げて録らなくてはなりません。これはあくまでも理論上ということなので
そんな極小のニュアンスはミックス後に残るのかというツッコミはこの際置いておきます。
その際にソースのレンジ幅が録音機器のレンジ幅に収まりさえすれば、わざわざ 0dB といったクリップするギリギリのレベルまで引き上げて
録音する必要はないことになりますが、どんな音でもでっかくすればよく聞こえるようになるという
いささかプリミティブな原理に則ると、できるだけソースの最大音を 0dB に近づけておく方が(相対的に最小音をできるだけ持ち上げておく方が)
データとして使い勝手がいいと思います。
そうでなくても、例えば同じソースを録るのにも入力レベルをパンパンにしてフルビットで録るのと、
その半分ほどの音圧、つまり半分のビットで録るのでは結果として録音されたデータの解像度が変わってきます。
最終的に音量を絞ってミックスする際にどこまでここで高めた解像度、音の精度が潰れるかはわかりませんが、
少なくとも編集、エフェクト処理段階では波形の解像度が生きているために、比較的優れた結果が出るのではないかと思います。
次にノイズ対策という観点ですが、これは実に単純な話です。機材類から混入するノイズと量子化ノイズ、これが常にほぼ一定の
レベルで混入してくるとするなら、入力するソースのレベルを高くすることで相対的にノイズを小さくすることができるからです。
また、ダイナミックレンジの広いソースを録る際にも最小音とノイズの間になるべく広くマージンを開けることができれば、
例えばコンプレッサーで小音を持ち上げて使う際などにノイズも一緒に拡大するリスクを多少なりとも抑えることができます。
というわけで、 0dB に合わせてレコーディングすることに関してはそれなりの意味はあるのではないかと思います。
ただ、私はノイズ対策としてはともかく音の解像度の差による結果の違いとかまでは聴いてもよくわからないので、
そこまで厳密にこだわらなくてもいいのではないかなと、どうしても思っちゃいます。人生はオキラクの方がいいです。
余談ですが、当然これはソースの入力レベルを上げることのメリットという話でして、
ソースのレベルはそのままで録音機器の感度を調節して結果的に 0dB に合わせてもあまり効果は出ないというか、
ノイズ対策としてはほとんど無意味であるどころか場合によっては逆効果になりえることを念のため付記しておきます。
また、ソース自体にノイズが多い場合なんかは入力レベルを上げると逆にデメリットにもなりますので
その辺は結局兼ね合い、ということになると思います。
それと録音したデータの音量が小さいからって何でもかんでも全部ノーマライズかけて使うのも無意味です。
ノイズ込みで振幅をフルビットに持ち上げてもあんまり美味しくないと思いますし、
もとのデータの段階で録れていない音はノーマライズしたって出てきませんから、音の解像度、精度は変わりません
(編集、処理には差が出るかもですが)。
そういう場合は素直にどうやって入力レベルを上げて録るかを考えた方がいいと思います。
居直り 005 Reserved
まだ記述はありません。