【デジタルオーディオの基礎】サンプリング周波数を徹底解説

サンプリング周波数の記事のアイキャッチ画像 お役立ち

デジタル音楽制作やオーディオ機器を扱う上で避けて通れないのが「サンプリング周波数」という概念です。44.1kHz、48kHz、96kHzなど、様々な数値を目にしたことがある方も多いかと思います。

この記事では、サンプリング周波数とは何か、そしてなぜこれらの数値が使われているのか、どうやって選べば良いのかを、初心者にもわかりやすく解説していきます。

サンプリング周波数とは何?

アナログからデジタルへの変換

音は空気の振動でできています。これをマイクで拾うと、時間とともに変化するアナログの電気信号になります。

しかし、パソコンやスマホはアナログ信号をそのまま扱えません。そこで必要なのが「サンプリング(標本化)」です。

サンプリングとは、一定時間ごとに音の大きさ(電圧)を記録することです。
このときの「1秒間に何回測定するか?」を表すのがサンプリング周波数です。

サンプリングの例

例えば、下記の波形から9点だけ値を取得(サンプリング)した場合このようになります。
値を取ったのは9点だけですが、元の波形の形がわかるのでないでしょうか?

サンプリング周波数の説明画像

この例では9点だけでしたが、実際には1秒間にもっと大きな数のサンプリングを行います。

  • 44.1kHz → 1秒間に 44,100回 サンプリング
  • 96kHz → 1秒間に 96,000回 サンプリング

つまり、サンプリング周波数とは「1秒間に音を何回記録するか」を示す値なのです。

サンプリング周波数:1秒間に音の大きさを記録(サンプリング)する回数

補足:ビット深度との違い

デジタル録音の音質は、サンプリング周波数だけで決まるわけではありません。
1回の記録で音の大きさをどれだけ細かく表現できるか を決める「ビット深度」も重要な要素です。
ビット深度については、こちらの記事で詳しく解説しています。

サンプリング周波数はどれを選ぶべき?

サンプリング周波数が大きい方が元の波形を再現できそうですよね。
「高ければ高いほど音が良くなる」と思われがちですが、必ずしもそうとは限りません。用途や目的に応じて、適切なサンプリング周波数を選ぶことが大切です。

目的別サンプリング周波数

理屈の説明は後にして、まずは各サンプリング周波数がどのような時に使われるかをざっと見てみます。

サンプリング周波数主な用途特徴
44.1kHz音楽CD、配信音源一般的な音楽に十分な音質。可聴帯域(20kHz)をカバー。
48kHz映像制作、放送映像のフレームレートと相性がよく、映像作品で標準的。
88.2kHzレコーディング44.1kHzの2倍で処理しやすく、編集後の変換もスムーズ。
96kHzハイレゾ音源、レコーディング48kHzの2倍。高音質録音や編集に適している。
192kHzハイレゾ音源、マスタリング超高精度記録。データ量は大きくなるが、最も情報量が多い。

CDなどの音楽用途では、44.1kHzのサンプリング周波数が使われていました。
一方、放送業界では映像との同期の都合から、48kHzの方が扱いやすく、こちらが標準として使われるようになりました。

現在では、音楽が映像と組み合わせられる場面も多くなったせいか、録音では48kHzも一般的に使われているようです。

ハードウェア・ソフトウェアが対応しているか要チェック

サンプリング周波数の用途や目的を説明しましたが、実際に使いたいソフトや機器でその周波数に対応していなければ使用することはできません

  • ソフトウェアの例
    ほとんどのDAWは 44.1kHz〜192kHz に対応していますが、例外もあります。
    例えば GarageBand は 44.1kHz 固定で変更できません。
  • ハードウェアの例
    多くのオーディオインターフェースは 44.1kHz〜192kHz に対応していますが、機種によっては制限があります。
    例として ZOOM AMS-22 は 192kHz 非対応(最大 96kHz)です。ただしこのサイズと価格で 96kHz に対応しているだけでも十分実用的です。

サンプリング周波数を設定する前に、お使いの機材・ソフトが対応しているかを必ず確認しましょう。

なぜその周波数が必要なのか?

ここからもう少し踏み込んで、なぜそのサンプリング周波数が必要なのかを理論的に説明していきます。

シャノンの標本化定理

音声信号をデジタル化する上で基礎となるのが、「シャノンの標本化定理(ナイキストの定理)」です。

元の信号をその最大周波数の2倍を超えた周波数で標本化すれば完全に元の波形に再構成される

標本化定理 – Wikipedia

信号の周波数の2倍を超える周波数で標本化(サンプリング)すれば元の信号を復元できます。
逆に言えば元の信号の2倍に満たない周波数でサンプリングした場合は、当然元の信号を復元できません。

この法則により、サンプリング周波数が足りないと、正確な波形を再現できないことがわかります。

サンプリング不足の例(3Hzの波形を4Hzでサンプリング)

下図は、3Hzの正弦波(1秒間に3回振動する)を4Hzでサンプリング(1秒間に4回値を取得)した例です。

4Hzでサンプリングした例の画像

標本化定理を満たしていない(2倍未満)ため、画像のように実際の波形と異なる波形が再現されてしまいます。

ギリギリ2倍の例(3Hzを6Hzでサンプリング)

次に、3Hzの波形を6Hz(ちょうど2倍)でサンプリングしてみます。

6Hzでサンプリングした例の画像

基本的には元の波形を再現できます。
ただし画像のように全て0のところをサンプリングしてしまうパターンがあり、問題が発生することがあります。

十分なサンプリング(3Hzを7Hzでサンプリング)

最後に信号の周波数の2倍より大きい7Hzでサンプリングを行った場合を見てみます。

7Hzでサンプリングした例の画像

標本化定理を満たすギリギリの周波数なので綺麗な波形には見えないかもしれませんが、綺麗な正弦波を再現する前提であれば図のように再構成可能となります。

最低限必要なサンプリング周波数

人間の耳が聞き取れる音の範囲は、おおよそ20Hz〜20kHzとされています。
このうち、20kHzの高音までを正確に記録するには、シャノンの標本化定理により、その2倍以上のサンプリング周波数が必要です。つまり、

20kHz × 2 = 40kHz 以上

が最低条件となります。

この理屈に基づいて設計されたのが、音楽CDで採用されている44.1kHzです。
20kHzまでの音を余裕をもってカバーでき、現実的なフィルタ設計や記録媒体の都合も考慮して少し大きいこの値に決まったのだと思います。

そのため、音楽用途においては 44.1kHz 未満のサンプリング周波数は実用的ではありません

どうして44.1kHzより大きなサンプリング周波数が存在する?

人間の耳が聞き取れる音は、おおよそ20kHzまでとされています。
つまり、44.1kHzのサンプリング周波数があれば、理論上は可聴範囲の音をすべて再現可能ということになります。

それにもかかわらず、なぜ 88.2kHz96kHz、さらには 192kHz といった、より高いサンプリング周波数が使われているのでしょうか?

理由はさまざまですが、ここでは代表的な3つの理由を紹介します。

ここで説明する内容はいわゆる「ハイレゾ音源の定義」とは少し異なる話です。
ハイレゾ=高音質という話ではなく、技術的な必要性から高いサンプリング周波数が選ばれる場面があるという話です。

1. フィルターの特性を良くするため

アンチエイリアシングフィルター

サンプリングの前には、「アンチエイリアシングフィルター」というアナログフィルターで、サンプリング周波数の1/2(ナイキスト周波数)を超える音を除去する必要があります。

先ほどサンプリング周波数が信号の周波数に対して不足していた場合に、実際の周波数よりも低い信号が出てきてしまう例を見ました。
例えば44.1kHzでサンプリングしている場合に、その半分の22.05kHzより大きい音が含まれていた場合それが原因で元の音にはない音を再現してしまう可能性があります。当然このような音はノイズとなります。

このようなノイズを防ぐため、録音前に高域をあらかじめ除去する処理が必要になります。

急なフィルターは作れない!

理想的には、「20kHz以下はすべて通し、それ以上は完全に遮断する」フィルターが望ましいのですが、現実にはそんな完璧なフィルターは作れません

実際のフィルターは、ある周波数から徐々に減衰していく形になります。

ローパスフィルターの減衰イメージ図

短い帯域幅で急激に落とす(=急峻な)フィルターを作ろうとすると、以下のような問題が発生します。

  • フィルター設計が難しく、コストや処理負荷が増大する
  • 群遅延と呼ばれる現象や位相特性(音のタイミング)に歪みが生じる

44.1kHzでサンプリングする場合、ナイキスト周波数は22.05kHz。
つまり、20kHz〜22.05kHzのわずか2kHzの帯域内で急激に音をカットしなければならないため、現実的にはかなり厳しい条件です。

サンプリング周波数が高ければ余裕ができる

例えば、96kHzでサンプリングすれば、ナイキスト周波数は48kHzになります。
この場合、可聴帯域(〜20kHz)とフィルターでカットすべき帯域(48kHz)の間に大きな余裕が生まれるため、フィルター設計が格段に楽になります。

結果として、音質への悪影響を減らすことができるのです。

2. エフェクトなどの処理の精度を良くするため

DTMや音楽制作では、さまざまな信号処理が行われます。

  • EQ(イコライザー)
  • リバーブ、コンプレッサー
  • ピッチシフト、タイムストレッチ など

これらは非線形な波形変形や補間処理を伴うため、音に歪みや不要な成分が生じるリスクがあります。

高いサンプリング周波数で処理を行えば、1秒間あたりのデータ点が増えるため、より細かい精度で演算ができ、そういったリスクを抑えて余裕を持って処理することが可能になります。

たとえば、EQで高音域をブーストしたとき、サンプリング周波数が低いとナイキスト周波数に近い領域の音を編集することになりノイズが発生する可能性があります。
96kHzや192kHzで処理すれば、余裕をもって高域処理が可能です。

3. 変換・ダウンサンプリングによる劣化を防ぐため

録音や編集作業では、高いサンプリング周波数で作業し、最終的に44.1kHzや48kHzに変換(ダウンサンプリング)するケースがよくあります。

このとき、たとえば88.2kHzは44.1kHzのちょうど2倍、96kHzは48kHzのちょうど2倍のため、整数比で変換できて音質劣化が起こりにくいという利点があります。

逆に、96kHzの音源を44.1kHzに変換する場合のように、比率が整数でないと、補間演算の誤差が生じ、変換時の音質がわずかに損なわれることがあります。

そのため、「編集や録音は高サンプリングで、納品や配信は低サンプリング」というワークフローが定着しています。

まとめ

サンプリング周波数とは、1秒間に音を何回記録するかを表す値です。
たとえば44.1kHzなら、1秒間に44,100回サンプリングされます。

人間の可聴域(〜20kHz)を記録するには、最低でも40kHz以上が必要とされており、CDでは44.1kHzが使われています。


一方で、88.2kHzや96kHz、192kHzといったより高いサンプリング周波数が使われる理由には次のようなものがあります:

  • フィルター設計を楽にし、音質劣化を抑えるため
  • EQやピッチシフトなどの処理を高精度で行うため
  • ダウンサンプリング時の変換誤差を防ぐため

つまり、最終的な用途に応じてサンプリング周波数を使い分けることが大切です。

  • リスニング・配信といった最終成果物 → 44.1kHz / 48kHz
  • 録音・編集 → 88.2kHz / 96kHz
  • 高解像度の録音 → 192kHz

無闇に高くする必要はありませんが、目的に合った設定を選ぶことで、より良い音を実現できます。

コメント

  1. 鍵和田喜一郎 より:

    よくわかりました。ありがとうございます

タイトルとURLをコピーしました