デジタル音楽制作やオーディオ機器を扱う上で、サンプリング周波数に並んで重要な基本概念が「ビット深度」です。16bit、24bit、32bit float など、録音設定や機材のスペックに並ぶこれらの数値を目にしたことがある方も多いのではないでしょうか。
この記事では、ビット深度とは何か、そしてそれが音にどう関係しているのか、各ビット数の違いと使い分けを含めて、初心者にもわかりやすく解説していきます。
ビット深度とは?
ビット深度(bit depth)は、アナログ信号をデジタル信号に変換する際の「振幅の精度の細かさ」を表す指標です。
デジタル録音では、アナログ波形を一定のタイミング(サンプリング周波数)で区切りながら、その瞬間の音の大きさ(振幅)を数値化して記録します。この「振幅の数値化(=量子化)」の際に、何段階で記録できるかを決めるのがビット深度です。
段階数の違いによるイメージ
たとえば、音の信号を 5段階 で記録したとすると、下図のようになります

元のアナログ波形の音の大きさを、5段階のうち最も近い値に丸めて記録することになります。
そのため、元の波形と比べるとかなり粗い形状になります。
次に、記録段階を 22段階 に増やしてみましょう。

5段階のときよりも、元の波形に近い形状になったのではないでしょうか?
このように、記録できる段階数(≒ビット深度)が多いほど、元の波形に近い音量(振幅)をより高い精度で再現できます。
実際のデジタル録音では
とはいえ、22段階でもまだまだ滑らかさには欠けます。
実際のデジタル録音では、16bit(= 2の16乗 = 65,536段階)以上で記録されるのが一般的です。
この程度の解像度があれば、人間の耳には元の波形との違いがほとんどわからないほど高精度に録音可能になります。
補足:ビット深度とビットレートの違い
よく似た言葉に「ビットレート」がありますが、意味は異なります。
- ビット深度 → 「1サンプルあたりの音量(振幅)をどれだけ細かく記録するか」
- ビットレート → 「1秒あたりに必要なデータ量(kbpsなど)」を表す指標で、サンプリング周波数やチャンネル数も関係
混同しやすいので注意が必要です。
補足:サンプリング周波数との違い
ビット深度は「音の大きさの細かさ」を決める指標ですが、デジタル録音の音質を左右するもう一つの要素がサンプリング周波数です。
サンプリング周波数は「音を1秒間に何回測定するか」を示すもので、ビット深度と組み合わせることで録音の精度が決まります。
サンプリング周波数については、こちらの記事で解説しています。
どのビット深度を選べば良い?

定番のビット深度
録音などのデジタル音声に使用される定番のビット深度は下記3つになります。
- 16 bit
- 24 bit
- 32 bit float
16 bit
CD音源などで使われているもっとも一般的なビット深度です。
2の16乗=65,536段階で音の大きさを記録できます。
人間の耳にとって十分なダイナミックレンジ(後述)を持ち、
主に再生用や配信用の音源に使われます。
24 bit
24bitは、スタジオ録音や音楽制作など、編集や加工を前提とした現場で使われるビット深度です。
16bitよりも約256倍細かく音を記録でき、理論上約144dBのダイナミックレンジを持ちます。
これは人間の耳が聞き取れる最も小さな音から最も大きな音までの範囲をほぼ完全にカバーしています。
小さな音まで精密に表現でき、録音や編集時にも音質劣化が起こりにくいという大きなメリットがあります。
32bit float
32bit floatは、16bitや24bitとはデータの扱い方が異なる特殊な録音形式です。
通常の16bitや24bitでは、録音レベルを適切に設定しないと音が割れたり、小さすぎてノイズが目立ったりすることがありますが、32bit floatでは録音後に音量調整をしても音質が劣化しにくいという特徴があります。
そのため、録音時にレベル調整が難しいフィールド録音やライブ収録など、不確実な環境でよく使われます。
ただし、適切にレベル調整された24bit録音と比べて、音質が劇的に良くなるわけではありません。 あくまで安全性・編集耐性を重視した録音形式と考えれば良いかと思います。
とはいえ、32bit floatは編集耐性が高く、録音レベルを16bitや24bitほど厳密に調整しなくても問題ないため、迷ったときはとりあえずこの形式を選んでおけば安心です。 特に設定に自信がない場合や、一発勝負の録音現場では強い味方になります。
16bitや24bit の場合は録音前に適切なレベル設定を
16bit や 24bit など、32bit float 形式以外で録音する場合は、事前に適切なレベル調整を行うことが非常に重要です。
たとえば、以下の図は録音時の音量が小さく、録音後に音量を持ち上げた波形の例です。

このとき、録音は22段階の解像度で行われていますが、実際には下位7段階分しか使われておらず、せっかくの解像度が十分に活かされていません。
この状態で後から音量を上げても、使われているのは7段階ぶんだけなので、結果として音質が粗く(解像度が低く)なってしまいます。
後述の32bit float 以外の録音形式を使用する場合は、録音前にきちんと入力レベルを調整しておくことが不可欠です。
※ちなみに「22段階」というのはあくまで図示のための例で、実際の16bitや24bit録音のビット深度とは関係はありません。
ハードウェアが対応しているか要チェック
32bit float録音はすべての機材で使えるわけではありません。
最近のDAWソフトウェアは32bit floatに対応しているものが多いですが、
実際に録音を行う場合は、オーディオインターフェースやレコーダーなどのハードウェア側も32bit floatに対応している必要があります。
特に一般的なオーディオインターフェースは、24bitまでしか対応していないものがほとんどです。
たとえば下記のようなZOOM製の一部オーディオインターフェースやフィールドレコーダーなど、32bit float対応を明確にうたっている製品でないと、32bit float録音はできません。
購入前や設定前には、機材が32bit float録音に対応しているか必ず確認するようにしましょう。
ハードとソフト両方の対応が揃って初めて、32bit floatのメリットが活かせます。
ダイナミックレンジって何?

ここからはもう少し踏み込んで、ダイナミックレンジについて説明します。
ダイナミックレンジ
ダイナミックレンジとは、「録音・再生できる最も大きな音と、最も小さな音の差(音量差)」をデシベル(dB)単位で表したものです。
ビット深度が大きくなるほど、振幅をより細かく記録できるため、ダイナミックレンジも広がります。
| ビット深度 | 段階数 | 理論上のダイナミックレンジ |
|---|---|---|
| 16bit | 2の16乗 = 65,536段階 | 約96dB |
| 24bit | 2の24乗 = 16,777,216段階 | 約144dB |
人間の耳が聞き取れるダイナミックレンジとは?
一般的に、人間の聴覚が捉えられる音の大きさの範囲(ダイナミックレンジ)は約120dBと言われています。
- 一番小さな音の目安:
静かな場所でかすかに聞こえる「耳鳴りレベルの音」や「落ち葉が舞う音」 - 一番大きな音の目安:
ロックコンサートのスピーカー前やジェット機の離陸音など、
それ以上になると痛みを感じるレベル
この120dBという範囲をカバーできるかどうかが、録音や編集のクオリティに関わります。
16bitと24bit、それぞれの限界と人間の耳
- 16bit:約96dB
人間の可聴範囲120dBにはわずかに届きませんが、日常的な音楽再生用途では十分な範囲です。 - 24bit:約144dB
人間の可聴範囲120dBを完全にカバーし、さらに余裕を持たせた設計になっています。
録音時の音量ミスや編集時の大幅な音量調整でも、音質劣化を最小限に抑えられます。
まとめ:ビット深度は目的に合わせて選ぶ
ビット深度は、デジタルオーディオにおける「音の細かさ」や「ダイナミックレンジ」を決める重要な要素です。
| ビット深度 | 特徴 | 主な用途 |
|---|---|---|
| 16bit | 約96dBのダイナミックレンジ | CD音源、配信用音源 |
| 24bit | 約144dBのダイナミックレンジ | 音楽制作、スタジオ録音 |
| 32bit float | 編集耐性・安全性重視 | フィールド録音、ライブ録音 |
- 再生用・配信用であれば16bitでも十分。
- 音楽制作や編集を前提とするなら24bitが安心。
- 録音レベルの調整が難しい現場では32bit floatが便利。ただし対応機材の確認は必須。
また、32bit floatは録音時のレベル設定を細かく気にしなくても大丈夫な「手軽さ」も大きなメリットです。
ハードウェアが対応していて、かつ設定に迷ったり録音環境が安定しない場合はとりあえず32bit floatを選んでおくと安心です。





コメント