by John Siau  February 10, 2017

原文 

サンプル間ピークのレベルオーバーはCDでは当たり前

当社では、Steely Danのアルバム「Two Against Nature」の楽曲「Gaslighting Abbie」をリスニングテストで頻繁に使用しています。この楽曲は、音の強弱変化が豊かで、低ノイズを特長とする録音ですが、5分強の尺で、左チャンネルに559、右チャンネルに570、合計で1129のサンプル間ピークによるレベルオーバーがあります。これは、毎秒約3.7個のサンプル間ピークによるレベルオーバーがあることを意味します。

この楽曲の信号を高ヘッドルームの補間器を使用して拡大することで、クリッピングがなかったらがどのようになっていたはずか、また、大半のオーバーサンプリング方式D/Aコンバーターで使用されている従来型の補間器でレンダリングしたときにどのようになるかを確認できます。下のグラフでは、従来型の補間器でクリッピングが発生した場所を示す赤い縦線が追加されています。

新しいテクノロジーを適切に適用すれば、CDはハイレゾ・フォーマットに匹敵する驚くべき結果をもたらすことができます。つまり、D/AおよびSRCデバイスに高ヘッドルーム補間器を使用することで、大幅な改善を得ることができるのです。このアプリケーションノートでは、サンプル間ピークをクリッピングなしで再構築およびレンダリングする方法を解説します。

CDフォーマットの歴史

コンパクトディスク(CD)は1982年に発表されました。35年経った今でも、44.1kHz/16ビットのCDオーディオフォーマットは、最も一般的なデジタルフォーマットです。ハイレゾオーディオフォーマットが推進にされている今日でも、新しい録音の大半はこのCDフォーマット(またはこのフォーマットから派生したファイル)でのみリリースされています。

CDフォーマットの持つ基本的な限界

CDフォーマットは、DCから22kHzの周波数特性と、約96dBのSN比を持っています。1982年時点では、サンプリング周波数44.1kHzとワード長16ビットは、人間の耳の限界、トランスデューサーの限界、一般的な録音および再生環境の限界に十分適うものとして選択されました。実際、16ビットのワード長は当時のD/Aコンバーターの能力を約2ビット上回ってさえいました。つまり、1982年時点では、16ビットを超える性能は不合理に思えたのでしょう。

オーディオ機器のハイレゾ対応への移行

近年、D/Aコンバーター、パワーアンプ、トランスデューサーは大幅に改善されています。たとえば、Benchmark DAC3コンバーターとAHB2パワーアンプは、128dBから132dBというSN比(A weighted = A特性聴感補正)を実現しています。これは、21〜22ビットを持つデジタルシステムの性能に相当する高い数値です。このような高品位のオーディオ機器の登場により、ハイレゾフォーマットへの移行が妥当なものとして推進されていますが、大半の音楽リスナーは、お気に入りの楽曲のほとんどがCDフォーマットでしか入手できないことに気付くでしょう。

CDフォーマットの性能を拡張する

幸い、CDフォーマットからより多くのパフォーマンスを引き出す方法を学んできました。新しい録音ではノイズシェーピング・ディザを使用することで、16ビットの量子化ノイズを20ビットフォーマットと同等のレベルに低減することができます。特殊なフィルターを備えたオーバーサンプリング方式コンバーターでは、全帯域で歪みを低減しながら、18kHz〜22kHzの高域特性を改善しています。さらに、これらのオーバーサンプリング方式コンバーターは、サンプル間でもアナログの元波形を正確に再構築することもできます。

これらの目覚ましい改善により、35年前のCDフォーマットの理論上の性能を新しいハイレゾ・フォーマットの性能に非常に近づけることができるようになりました。古い録音でさえ、D/Aコンバーターとパワーアンプの性能改善の恩恵を受けることができますが、新しい録音では、録音に使用されるノイズシェーピング処理と性能改善されたA/D変換による恩恵がさらに追加されます。

耳で捉えることのできるノイズはまだ存在する

こうした新しいテクノロジーをすべて適切に適用すると、CDはハイレゾ・フォーマットに匹敵する驚異的な結果をもたらすことができます。

理論的には、最高レベルCD録音が持つ周波数特性とノイズ性能は、44.1kHz/16ビットPCMシステムの制限から生じる可聴欠陥を排除するのに十分なはずですが、残念ながら単純化しすぎています。ほとんどのオーバーサンプリング方式D/Aコンバーターは、44.1kHz録音を再生するときに耳で捉えることのできるノイズや欠陥を生成すると、当社Benchmarkでは考えています。こうしたノイズや欠陥は、オーバーサンプリング補間フィルターのヘッドルームが不十分であることが原因で発生しています。しかし、幸いなことに、こうしたノイズや欠陥は防止することができます。

オーバーサンプリング処理によって露呈するサンプル間ピーク

PCMデジタルシステムは、時間方向の離散化でオーディオ波形をサンプリングします。サンプルは波形のピークで発生する場合もありますが、ほとんどの場合、ピークはサンプルとサンプルの間で発生します。以下の図は、デジタルシステムによってサンプリングしたアナログ波形を示しています。「1」と「-1」は、最大および最小のデジタル符号を表します。16ビットシステムでは、これらのデジタル符号の値は+32,767および-32,768になります。

以下の図では、ピークが最大符号と最小符号を1.414倍(3.01 dB)も超えていることに注目してください。この最悪の例は、オーディオ信号がサンプリング周波数の1/4の場合に発生します。44.1kHzシステムでは、このワーストケースは11kHz付近で発生します。高いサンプリング周波数を使用するハイレゾ・システムでは、可聴成分がほとんどない超音波領域でワーストケースが発生するので、この問題が発生する可能性ははるかに低くなります。

サンプル値を高いサンプリング周波数で補間する場合(オーバーサンプリングD/Aコンバーターで行われるように)、サンプリング結果は通常以下のようになります。

上図では、オーバーサンプリングD/Aコンバーターの補間器は、元のアナログ波形を再現しようと試みた結果、大きくクリッピングした正弦波を生成します。一部のD/Aコンバーターでは、デジタル信号処理上でのオーバーフローによって発生する歪みがこれに追加されます。いずれの場合も、このような従来型オーバーサンプリングD/Aコンバーターでは、サンプル間ピークによるレベルオーバーが発生するたびにバースト歪みを生成してしまいます。サンプリング周波数変換を行うSRCチップやASRCチップでも補間器を使用しており、同様のオーバーロードの問題があることにご注意ください。多くのSRCおよびASRCチップで生じる音質変化は、このオーバーロードの問題に起因する可能性がある、というのが当社の見解です。

不完全なDACチップとSRCチップ

当社BenchmarkでテストしたすべてのDACチップとSRCチップに、サンプル間ピークによるクリッピングの問題があることが判りました。私たちの知る限り、この問題に適切に対処したチップメーカーは1社もありません。このため、市場に出回っているほぼすべてのデジタルオーディオ機器には、サンプル間ピークによるオーバーロードの問題があります。この問題は、サンプリング周波数44.1kHzを再生するときに最も顕著になります。

高ヘッドルーム補間技術

クリップしたり、オーバーロードしない補間器を構築することは可能ですが、DACチップやSRCチップのメーカーはそれを行っていません。そのため、Benchmarkはデジタル処理の一部をDACチップの外に移動しました。

BenchmarkのDAC2、DAC3コンバーターは、0dBFSを超える3.5dBのヘッドルームを持つ外部補間器を装備しています。これは、サンプル間ピークのワーストケース+ 3.01dBFSに対し、クリッピングを起こさずに処理できることを意味します。


また、ESS製DACチップを-3.5dBで駆動し、ES9018およびES9028PROコンバーターチップ内部ではクリッピングが発生しないようにします。結果を以下の図に示します。

それが機能することの証明


従来のD/Aコンバーターと高ヘッドルームD/Aコンバーターの出力の周波数解析を行うと、違いがわかります。

緑のプロットは、高ヘッドルームを持つBenchmark DAC2を測定した結果です。DAC2は、振幅+ 3.01dBFSの11.025kHzの正弦波を正しく再現しました。一方、赤いプロットは、同じテスト条件下でのBenchmark DAC1の出力を測定したものです。市場に出回っているほとんどの製品と同様に、古いDAC1は従来方式の補間器を使用しており、サンプル間ピークが0dBFSを超えるとオーバーロードになります。赤いプロットでは、11.025kHzトーンの高調波ではない歪み成分が多数発生していることに注意してください。これらの相互変調歪み成分は、テストトーン、サンプリング周波数、およびオーバーサンプリング周波数の間の相互作用によって発生するものです。このIMD歪みは音楽的なものではなく、アナログシステムでは発生しないものです。デジタルオーディオで良く言われる「デジタル臭さ」を生み出します。また、発生する歪みのほとんどが5kHz〜22kHzで発生していることに注意してください。オーバーロードが発生した時には、これらの歪成分によって高域が不自然に強調されたり、冷たい音になる可能性があります。

ではサンプル間ピークによるレベルオーバーはどのくらいの頻度で発生するのでしょう?

サンプル間ピークによるレベルオーバーはCDではごく普通にある現象

当社では、Steely Danのアルバム「Two Against Nature」の楽曲「Gaslighting Abbie」をリスニングテストで頻繁に使用しています。この楽曲は、音の強弱変化が豊かで、低ノイズを特長とする録音ですが、5分強の尺で、左チャンネルに559、右チャンネルに570、合計で1129のサンプル間ピークによるレベルオーバーがあります。これは、毎秒約3.7個のサンプル間ピークによるレベルオーバーがあることを意味します。最も高いレベルのサンプル間ピークは+0.8dBFSに達します。しかし、楽曲そのものはクリップはしておらず、44.1kHzサンプリングが単純に0dbFSを超えたピークを忠実に捉えていることが判ります。1129のサンプル間ピークのうち、993で+0.5dBFSを超える値が測定されます。以下の波形写真では、サンプル間ピークは赤で表示されています。

例1:「Gasligting Abbie」(Steely Danのアルバム「Two Against Nature」より)

前述したように、この楽曲には1129箇所のサンプル間ピークによるレベルオーバーがありますが、楽曲自体はクリップしていません。これらのサンプル間ピークによるレベルオーバーは、高ヘッドルーム補間器でレンダリングすれば正確に復元できる音の強弱が含まれています。

残念ながら、録音過程でキャプチャされたこれらの動的ピークは、ほとんどのD/Aコンバーターでは再現することができません。これらのピークは、従来型の補間器ではオーバーロードとなり、各レベルオーバーは衝撃音のバーストノイズとしてレンダリングされてしまいます。そのため、この楽曲を再生すると、オーバーロードした補間器は音質を変化させ、スネアドラムの打音に本来無かった明るさを追加する傾向が現れます。

Benchmark DAC2およびDAC3コンバーターは、高ヘッドルームの補間器を装備した数少ないD/Aコンバーターです。これらのコンバーターは、録音過程でキャプチャされたサンプル間ピークを正確にレンダリングすることができます。クリッピングを起こさずにレンダリングできる場合に限り、この楽曲の持つ音楽ダイナミズムを理解することができるのです。

テストの手法

サンプル間ピークの数をカウントするために、振幅を3dB減衰し、8倍補間を適用して、クリッピングなしでサンプル間ピークをレンダリングし、次に、8倍(352.8 kHz)のサンプリング周波数で作業し、再構成されたサンプル間ピークの振幅を測定しました。次に、ゲインを3dB増やして、楽曲を元の振幅に戻しました。こうすることで、1129箇所のサンプル間ピーク・レベルオーバーを赤で強調表示することができました。これらの機能を実行するために、非破壊型音声編集ソフトのAudacityを使用しています。

ズーム・インする

以下はGaslighting Abbieの一部分で、従来型の補間と高ヘッドルーム補間を比較した波形です。上の2つは、従来型の補間器で8倍補間されたもの、真ん中の2つのトラックは、高ヘッドルーム補間器で8倍補間されたもの、下の2つは、従来型の補間器でクリッピングが発生する場所を赤線で示したものです。測定に使用した部分は2:30.46880で始まり、2:30.47015秒で終わり、この録音に含まれるサンプル間ピーク・レベルオーバーの多さとしては典型的なものです。

44.1kHzのCDのサンプリング周波数でもサンプル間ピークをきちんとキャプチャすることができていることに注目してください。高ヘッドルーム補間を適用すると、音楽に含まれる元のピークが復元され、正確にレンダリングを行うことができています。この高ヘッドルーム補間技術により、スタジオのA/Dコンバーターによってキャプチャしたアナログ元信号を正確に再現することができます。

サンプル間ピーク・レベルオーバーはCDではごく普通にある現象

サンプル間ピーク・レベルオーバーは、Gaslighting Abbieという楽曲、あるいはSteely DanのCDアルバム「Two Against Nature」に固有のものではありません。ほとんどのCD録音には、サンプル間ピーク・レベルオーバーが含まれています。

その他の例

サンプル間ピークが0dBFSを超えるその他の例を以下に示します。

例2:「What a Shame About Me」(Steely Danのアルバム「Two Against Nature」より)

サンプル間ピーク・レベルオーバーは赤線で表示されています。最も高いレベルのサンプル間ピークは+0.486dBFSに達しています。

例3:「Janie Runaway」(Steely Danのアルバム「Two Against Nature」より)

サンプル間ピーク・レベルオーバーは赤線で表示されています。最も高いレベルのサンプル間ピークは+0.565dBFSに達しています。

例4:「Begin To Hope」(Regina Spektorのアルバム「Fidelity」より)

サンプル間ピーク・レベルオーバーは赤線で表示されています。最も高いレベルのサンプル間ピークは+1.49dBFSに達しています。この楽曲ではサンプル間ピーク・レベルオーバーのほとんどが右チャンネルで発生しています。右寄りにパンニングされたパーカッションによるものと思われます。

例5:「Get Lucky」(Daft Punkの18枚目シングル曲、88.2kHzオリジナルソース)

サンプル間ピーク・レベルオーバーは赤線で表示されています。最も高いレベルのサンプル間ピークは+0.485dBFSに達しています。

注:この楽曲は-0.01dBFSにハードリミッター処理された88.2kHz録音です。4倍サンプリングの352.8kHzに補間する際、このハードリミッター処理によりサンプル間ピーク・レベルオーバーが発生します。従来型の補間器では赤線で示されたピーク部分に歪みを発生することを意味します。

例6:「Rich Woman」(Alison Krauss & Robert Plantのアルバム「Raising Sand」より)

2007年にGavin LurssenによってマスタリングされたこのCD楽曲は大音量で録音されていまが、驚くべきことにサンプル間ピーク・レベルオーバーがありません。この波形は、サンプル間ピーク・レベルオーバーのないCDを作成できることを示唆していますが、コンバーターとSRCチップが高ヘッドルーム補間器を装備している場合はそもそも関係ありません。