
HiFi日記:HQPlayerディザー設定詳解
この記事は、以前投稿した「HQPlayerフィルター設定詳解」と対になる、もう一つのチュートリアルです。そして、HQPlayerの設定紹介シリーズの最終回となります。ぜひブックマークしておくことを強くおすすめします。今後HQPlayerにアップデートがあった場合、この記事も追って更新していく予定です。
一、HQPlayerのディザーについて詳しく解説
デジタルオーディオ処理において、ビット深度を下げる際(例:24bitから16bitへ変換)、量子化ノイズが発生します。**ディザー(Dither)とノイズシェーピング(Noise Shaping)**は、この量子化ノイズを処理するための二つの主要な技術です。HQPlayerでは、これら二つの機能が「Dither」オプションに統合されています。この解説は、HQPlayerの進化に合わせて、随時更新していきます。HQPlayerのチュートリアルシリーズはこちらからご覧ください。
1. ノイズシェーピング (Noise Shaping):
フィードバック機構を利用して、量子化ノイズのエネルギーを人間の耳が敏感でない周波数帯域(通常は超音波帯域)へと追いやる技術です。これにより、可聴域内のノイズレベルを低減させます。次数が高いほど、可聴域内のノイズ抑制効果は高まる傾向にありますが、その分、超音波帯域のノイズピークが高くなり、CPUへの負荷も増大します。
2. ディザー (Dither):
ごく少量のランダムなノイズを加えることで、量子化誤差を信号と無相関なものに拡散させます。これにより、微小信号の歪みや、量子化ノイズによる変調効果を取り除きます。
さて、せっかくの解説なので、ブログ主がもう少し深掘りしてみたいと思います。HQPlayerを使っている方なら、ビット深度を下げる設定はしないでしょう。ほとんどの方が16bitから32bitへ、あるいは24bitから32bitへとアップサンプリングしているはずです。
理論上、ビット深度を上げる際には、新たな量子化ノイズは発生しません。16bitのオーディオを32bitに変換する場合、元の16bitデータは32bitの「器」に入れられ、通常は値を左にシフトし、下位ビットはゼロで埋められます。このプロセスでは情報が失われることも、新たな量子化誤差が生まれることもありません。
例えるなら、解像度の低い写真(例えば16ビットカラー)を、より多くの色深度をサポートするフォーマット(例えば32ビットトゥルーカラー)で保存するようなものです。写真がそれで鮮明になったり、色数が増えたりするわけではありません。単に、元の16色の情報を、より多くの色を格納できるフォーマットで保存しただけです。色の情報が失われていないので、色数が減ることによる「色のノイズ」を処理する必要はありません。
したがって、16bitから32bitへの変換プロセス自体には、ディザーやノイズシェーピングは不要なはずです。元の16bitオーディオに固有の量子化ノイズは依然として存在しますが、ビット深度を上げる操作自体が新たなノイズを加えることはないのです。

しかし、 多くの皆さんが気づいていることと思いますが、16bitから32bitへのアップサンプリングであっても、ディザーのオプションを変えると音が変化します。これは上記の理論と矛盾します。これにはいくつかの可能性が考えられます。
1. HQPlayerの内部処理精度が32bitをはるかに超えている:
HQPlayerは、アップサンプリング、フィルタリング、音量調整など、すべての内部処理において、通常64bit浮動小数点数のような非常に高い精度を使用しています。これは、複雑な計算過程での誤差の蓄積を最小限に抑えるためです。16bitのオーディオがHQPlayerに入力されると、まずこの高精度な内部フォーマット(例:64bit浮動小数点)に変換されます。元の16bitオーディオに固有の量子化ノイズも、この64bitの器の中で高精度に表現されます。最終的にHQPlayerが出力するのは、この内部の64bit浮動小数点精度から、選択された出力ビット深度(例:32bit)へと変換するプロセスです。(これは実証できたわけではなく、あくまで推測です。詳しい方がいらっしゃれば、ぜひ補足をお願いします。)
2. 出力が32bitであっても、ディザー/ノイズシェーピングはノイズ特性に影響を与える:
32bitというビット深度は、元の16bit/24bitの解像度をはるかに超えており、64bit浮動小数点数の有効精度(約24bit)の大部分もカバーしています。理論上、64bit浮動小数点から32bit整数または浮動小数点への変換時に、ディザーでマスクする必要があるような新たなトランケーション(切り捨て)歪みは生じないはずです。しかし、ディザーとノイズシェーピングの役割は、単にトランケーション歪みを防ぐだけではなく、最終的な出力信号のノイズ特性そのものに影響を与えます。
- ノイズシェーピング: ノイズシェーピングの核心は、ノイズエネルギーを周波数上で再分配することです。たとえ32bitで出力する場合でも、シェーパーはあらゆる低レベルのノイズ(元の16bitオーディオ固有のノイズ、HQPlayerの内部処理で生じる微小な計算ノイズなど)を高周波帯域へ追いやろうとします。異なるノイズシェーパーは、それぞれ異なるノイズスペクトル曲線を生み出します。32bit出力では、これらの低レベルノイズをトランケーション歪みなしに表現する十分な「スペース」がありますが、シェーパーの働きは、これらのノイズが周波数上でどのように分布するかを変えます。このノイズスペクトルの変化は、たとえノイズの総量が変わらなくても、聴感上の違いを生む可能性があります。例えば、ノイズを超音波帯域に追いやることで、可聴域の背景がより「黒く」感じられたり、超音波帯域のノイズピークが後段の機器の挙動に微妙な影響を与えたりすることが考えられます。
- ディザー: ディザーは、ランダムなノイズを加えて量子化誤差を拡散させる技術です。理論上、64bit浮動小数点から32bit出力への変換でトランケーション歪みを防ぐためのディザーは不要だとしても、TPDFやGauss1といったディザーオプションを設定すれば、HQPlayerは最終的な32bit出力にそのランダムノイズを加えます。加えられたランダムノイズは、最終的な出力信号のノイズフロアを変化させ、元の量子化ノイズや処理ノイズをランダムノイズで置き換えたり、それに重ね合わせたりします。ディザーの種類が異なれば、加えられるノイズの特性も異なります。このノイズフロアの変化は、たとえトランケーション歪みをマスクするためでなくても、直接聴き取れるものです。人によっては、高いビット深度であっても少量のディザーを加えることで、音がより滑らかに、あるいは自然に聞こえるとさえ考えています。
二、ノイズシェーパー (Noise Shapers)
- NS1:
- 特徴: 最もシンプルな1次(1st-order)のノイズシェーパーです。ノイズシェーピングのカーブは非常に基本的で、ごく少量のノイズしか高周波に追いやれず、効果は限定的で滑らかさにも欠けます。まさに「壁にぶつかる」ような感じです。
- 用途: 通常のオーディオ再生や出力シーンでの使用は一切おすすめしません。性能は他のオプションに遠く及びません。主に技術的なテストや、より高度なシェーパーとの比較基準として存在します。
- NS4:
- 特徴: 4次(4th-order)のノイズシェーパーです。4段階の処理を経て、量子化ノイズのエネルギーを低周波域からより高い周波数へと移動させます。NS1に比べて、より効果的なノイズシェーピングを提供します。
- 用途: このシェーパーのノイズシェーピングカーブは、88.2kHzや96kHzといった中程度のハイサンプリングレートに最適化されていることが多いです。これらの周波数では、可聴域で良好なノイズ抑制効果を発揮し、超音波帯域のノイズ特性もこの帯域幅に適しています。
- NS5:
- 特徴: 5次(5th-order)のノイズシェーパーです。NS4よりもアグレッシブで、より多くの量子化ノイズエネルギー(シェーピングなしに比べて40dB以上)を、可聴域から非常に高い超音波周波数へと追いやることを目指しています。
- 用途: 352.8kHz、384kHz、およびそれ以上のDXDやDSDといった、非常に高い出力サンプルレート向けに設計されています。これらの極めて高い周波数では、可聴域外に追いやられたノイズピークを収める十分な「スペース」があります。標準または中程度のサンプルレートでの使用には適していません。
- NS9:
- 特徴: 9次(9th-order)のノイズシェーパーです。NS5よりも次数が高く、可聴域の終わり際でノイズシェーピングカーブがより急峻に立ち上がることを意味し、結果として可聴域内でより優れたノイズ抑制効果を発揮します。高次でありながら、超音波帯域のノイズピークはNS5よりも滑らかで管理しやすいように設計されていることが多いです。あなたが感じた「より丸みを帯びた」感じは、この超音波ノイズ特性を指しているのかもしれません。
- 用途: このシェーパーは特に176.4kHzや192kHzといった中高サンプルレートに適しています。これらの周波数でNS4よりも強力なノイズシェーピング効果を提供し、その特性もこの帯域幅にマッチしています。
- LNS15:
- 特徴: 非常に高次な、通常は15次(15th-order)のノイズシェーパーです。HQPlayerで提供される中で最も次数の高いシェーパーの一つです。高次であることは、量子化ノイズエネルギーの大部分を可聴周波数域から極めて高い超音波周波数へと追いやれることを意味します。可聴域内でのノイズ抑制効果は、通常、全シェーパーの中で最も強力です。
- 用途: 主に352.8kHz, 384kHz, 705.6kHz, 768kHz、およびDSD出力といった、極めて高い出力サンプルレート向けに設計されています。標準または中程度のサンプルレート(44.1/48/88.2/96/176.4/192kHz)での使用には適していません。超音波ノイズピークが可聴域に近すぎたり、集中しすぎたりする可能性があり、ハードウェアへの要求が非常に高くなります。
- ※注意点: 極めて高次のノイズシェーパーは、超音波帯域に非常に高く、集中したノイズピークを生成します。これは、あなたのDACや後段のオーディオ機器(アンプなど)が、これらの超音波エネルギーを悪影響(例:過負荷、相互変調歪み、トランジェント応答の制限など)なしに、クリーンに処理できる能力を要求します。
- shaped:
- 特徴:
shaped
は、比較的汎用的なノイズシェーピングのオプションです。NSシリーズのように特定の高サンプルレートに最適化されたアグレッシブなカーブではなく、よりクラシックで標準的な、CDの解像度(16bit)やサンプルレート(44.1/48kHz)向けに設計されたノイズシェーピングカーブを指すことが多いです。ノイズの一部を高周波に追いやりますが、通常は高次のNSオプションほど強力ではありません。 - 用途: どのNSオプションを選ぶか迷った時や、より伝統的で過激でないノイズシェーピングを好む場合に使える、汎用的な選択肢です。TPDFやGauss1と組み合わせて、ノイズシェーピングを適用した16bit出力を実現する際の一般的な組み合わせであり、特に44.1kHzや48kHz出力に適しています。
- 特徴:
- none:
- 特徴: ノイズシェーパーとして
none
を選択すると、ビット深度の低減プロセスは単純な**トランケーション(切り捨て)**になります。トランケーションは、下位ビットのデジタル情報を単に破棄する処理です。 - 用途: 通常のオーディオ再生や出力シーンでの使用は絶対におすすめしません。これは、意図的にトランケーション歪みがどのようなものかを聞くといった技術的なテストや、後段の機器で処理することが明確に分かっているごく特殊な状況でのみ使用されますが、そのような場合でも通常はディザーを適用すべきです。
- ※注意点:
none
は、一部のベテランのオーディオファイルが言うような「何もしないのが一番ピュアでHIFIな出力」というわけではありません。デジタル技術には敬意を払いましょう。
- 特徴: ノイズシェーパーとして
三、ディザー (Dithers)
- RPDF (Rectangular Probability Density Function):
- 特徴: 最もシンプルなディザータイプで、一様分布のランダムノイズ(均一なサイコロを振るイメージ)を加えます。量子化誤差を効果的に拡散させますが、加えられるノイズエネルギーが比較的高く、ホワイトノイズのように聞こえます。
- 用途: 主に技術的なテストや、最も基本的なオプションとして存在します。より優れた選択肢があるため、高品質なオーディオ用途では基本的に推奨されません。可聴域のノイズを増加させてしまいます。
- TPDF (Triangular Probability Density Function):
- 特徴: 業界標準のディザータイプで、三角分布のランダムノイズ(均一なサイコロを2つ振ってその和を取るイメージ)を加えます。TPDFはRPDFよりも加えるノイズエネルギーが低く、より自然に聞こえ、かつ非常に効果的に量子化誤差を拡散させます。CPU負荷も非常に低いです。
- 用途: あらゆるシーン、あらゆるサンプルレートに適しています。CPU負荷の低さと良好な効果から、44.1kHzや48kHzといった標準的なサンプルレートにおける優れたデフォルトオプションであり、多くのプロ用オーディオソフトウェアで推奨されているディザータイプです。
- Gauss1 (Gaussian Probability Density Function):
- 特徴: ガウス(正規)分布のランダムノイズを使用するディザーです。理論上、ガウスディザーはTPDFよりも優れていると考えられています。生成されるノイズと信号との相関がより低く、変調歪みが少なくなる可能性があるためです。ただし、より多くのCPUリソースを消費します。
- 用途: すべてのシーンとサンプルレートに適しています。理論上、より優れた性能を提供するため、究極の効果を追求する際の選択肢となります。
