音声の基本
はじめに
ある特定の部屋で体験できる音声品質は、その音声に対して行われる信号処理、スピーカーとそのコンポーネントの品質、スピーカーの配置など、さまざまな要因による影響を受けます。反射、吸収、拡散など、部屋自体の特性も重要です。オーディオ体験を最適化するために、コンサートホールでは天井や壁が調整されていることをご存じでしょうか?
本書では、基本的な音声の用語と、室内の音声品質に影響を与える特性の概要を説明します。また、さまざまなスピーカータイプの背景情報とオーディオ設備の最適な配置についても紹介します。
音声周波数
可聴周波数
人間の耳は理論上、20Hzから20kHzまでの周波数を知覚することができます。20kHzの上限は年齢とともに低下しますが、それでも高周波数は倍音を通じて低周波の音声に「特徴」を加えることができます。人間の話し声は、多くのハーモニーを伴う複雑なもので、85Hz付近 (人間の男性の最低周波数) から8kHz付近 (人間の女性の倍音) までの周波数に分布しています。電話では、300Hz〜3.4kHzの範囲のみが一般的に使用されており、音声は聞き取ることができますが、全周波数範囲まで録音された音声ほど明瞭になりません。
サンプリング周波数
サンプリング周波数は、アナログ入力音声をデジタルで再構成するために取得した1秒あたりの音声の「スナップショット」数です。音声ファイルとCDでは、 44.1kHzが一般に使用されます。つまり、1秒あたり44,100のサンプルを使用しています。サンプリング周波数は、再構成されるべき最高の入力音声周波数の少なくとも2倍以上である必要があります。
周波数と波長
周波数 (f、単位はHz) と波長 (λ、ギリシャ文字のラムダ、単位はm) の間には単純な逆相関があります。
λ=v/f
波長は音速 (空気中ではv=340m/秒) を周波数で割ったものに等しくなります。波長と周波数を素早く変換するには、オンラインツールを使うこともできます。音声の波長の例をいくつか挙げると、20Hzの周波数は約17mの波長に相当し、20kHzの高い周波数は約1.7cmの短い波長に相当します。明らかに、私たちが知覚できる音声の波長には広い幅があります。
音響と部屋の寸法
エコー
完全に空の部屋では、音の残響や遅延が発生します。これは、もちろん音波が反響するには平らな面が最適であるからです。ソファやカーテン、カーペットなどの布地や不均一な面が加わると、残響は少なくなりますが、吸収されるため、音の大きさもやや小さく感じられます。
多くの場合、音波は人の耳に届くまでに複数回反射されます。空気中での音の速度は、340m/秒であるため、エコーが伝わった距離を計算できます。たとえば、初めて音が鳴って0.25秒後のエコーが聴こえた場合、音は約85m (0.25秒 x 340m/秒) の距離を伝わっています。反射のたびに、音声は聴こえなくなるまで少しずつ弱まります。
部屋の寸法の影響
部屋の大きさはオーディオエクスペリエンスに大きな影響を与えます。人間の耳が聞き取れる最も低い音の波長は17m、この波長が小さな部屋で反射すると、波が適切に発達する前に壁に反射してしまいます。そのため、関連する定常波と共鳴が発生し、一部の周波数が増幅され (大音量)、その他の周波数が減衰 (小音量) されます。歪みのない低音を聴くには、かなり広い部屋が必要です。
オーディオ品質への共鳴 (レゾナンス)の影響は、音量とともに増加します。音量が大きいほど、反射は音源からの音に干渉します。
小さな部屋の低周波数 (低い音) は、部屋が音を支配していると言えます。一方で、より高い周波数 (高い音) では、スピーカーが音を支配します。小さな部屋の場合、部屋の遷移周波数は300Hz程度になるのが通常です。この周波数は、音声が波のような振る舞いから光線のような振る舞いに移行する周波数と言えます。
ニュートラルな室内音響のためのプロフェッショナルソリューション
広い部屋や誰もいない部屋での不快なエコーを減らすために、音響パネルを天井や壁、またはその両方に設置することができます。これらのパネルは吸音材で製作され、ショッピングモール、講堂、オフィス、会議室などの空間でよりニュートラルな音響を生み出します。ただし、カーテンやその他のインテリアファブリックスを使用することで、同様の効果を得ることができます。
通常、音響パネルは300Hz以上の周波数にはかなり効果的ですが、低い周波数では吸収能力が徐々に低下します。

音の測定
このセクションでは、人間の音の知覚、音のさまざまな測定方法、およびそれら相互関係について説明します。
人間の音の知覚とフォン (phon)
人間の耳は20Hzと20kHzの間のすべての周波数に敏感ではありますが、周波数によって感度が変わります。そのため、特定のパワーの音は、異なる周波数で異なるラウドネスを持っているように知覚されます。ラウドネスの単位「phon」はこの感度が考慮されており、たとえば、50phonの正弦波の音は、すべての周波数で同じ大きさとして知覚されます。
下の図2は等ラウドネス曲線を示します。1本の線は、音がすべての周波数で同じ音量で知覚されるように、使用しなければならない音響レベルを表しています。別の線は異なるphon値を表しています。
曲線から明らかなように、高い周波数と同じ大きさとして知覚されるためには、音響レベルは低周波数ではかなり高くなければなりません。これは、人の耳が低音域では感度が低いためです。曲線の最小値は2kHz~5kHz付近にあり、これは人の耳が最も敏感で、会話を最も理解できる周波数範囲であることを意味します。これは、人のスピーチの周波数範囲でもあります。
ワット
パワーの単位、ワット (W) は、電球やノートパソコンの充電器、スピーカーなどさまざまな電装品でお馴染みです。ただし、この単位はさまざまなやり方で使用可能で、音声用語では、瞬時電力、平均電力、RMS (二乗平均平方根) 電力、ピーク電力などの多様な種類を目にします。
ドラムや爆発、その他の短くて騒々しい音声が聴こえる場合など、非常に短い時間に300 Wを出力できるようにアンプが構築されている場合があります。これは、瞬時パワーが非常に低い状態から非常に高い状態へと実際に早く上がるということを意味します。しかし、同じアンプでも、連続使用の場合はより多くの熱を発生させ、電気部品とアンプの性能の両方に影響を与えるため、連続使用では50Wしか定格がない場合があります。
人間の耳は、10Wの音を5Wの音の2倍の大きさとは感じません。実際、耳が2倍の音量と感じるためには、音のパワーを10倍 (50W) にする必要があります。ここでデシベルの登場です。
デシベル
音は非線形に知覚されるため、非線形単位のデシベル (dB) を用いて測定し、記述するのが最適です。音響パワーの2倍 (Wで測定) は3dBの増加に相当し、ラウドネスの2倍は10dBの増加に相当します。図3は、身近な音源とそのパワーレベル(dB)を示します。
重み付けdBAスケールで示される音圧レベルは、セクション4.1で説明したように、人間の耳の周波数に依存する音の知覚に合わせて補正されています。重み付けのないdBスケールを使用すると、たとえば100Hzでの100dBレベルは、1kHzでは80dBに等しい音量として知覚されますが、100dBAであれば、すべての周波数で同じ音量として知覚されます。
多くの場合、デシベル単位は音のラウドネスの相対的な変化を指します。絶対値を表す場合は、dB SPLを使用します。0dB SPLの値は人間の耳が感知できる最も小さな音です。
音圧レベル
音圧レベル (SPL) とは、一定時間内に測定された瞬間的な音圧の実効値で、単位はdBです。 SPLはラウドネスの一定の平均値ではなく、短いピーク値の平均値です。
スピーカーに示されたSPL値は、特に指定されていない限り1kHzの音を距離1mで測定したものです。
音源の音圧レベルは、音源からの距離に応じて減少します。図4に示すように、音源から1mの位置で0dBから始まると定義すると、音源からの距離が2倍になるごとにSPLは6dBずつ減少します。ただし、ある特定のスピーカーのサウンドレベルについてより詳細な情報を得るには、セクション6.1で例示したように、その極性応答を見る必要があります。
ダイナミックレンジ、圧縮、ラウドネス
録音には大きなダイナミックレンジがあり、これは最も静かな部分と最も大きな音の部分には大きな差があることを意味します。

静かな部分の音が大きくなり、音が大きい部分は変わらないか小さくなります。ピークとディップの差が小さくなっているため、この録音は音が大きく感じられます。図6からわかるように、ダイナミックレンジが減少しています。

ダイナミックレンジの圧縮は、比較的静かな音量でBGMを再生するレストラン、小売店、および同様の公共環境の音声システムによく適用されます。音量を一定にすることとは別に、圧縮することで、周囲騒音よりも音声の静かな部分がより聞き取りやすくなります。
スピーカー
スピーカーは、その目的によってさまざまな物理的形状を持たせることができます。音声を送り出す部品であるスピーカードライバーは、通常はコーン型ですが、高周波を再構成する必要がある場合は、他の形状にもできます。スピーカーの中には、一方向に高い音圧を出すために、音の方向が非常に狭くなっているものがあります。その他のものは、できるだけ音が広がるように製作されています。スピーカーが音声信号を再構成する能力は、音声信号の周波数に依存します。
極性応答
図8の極性ダイアグラムは、図の中央に置かれた一般的なスピーカー例から、異なる周波数がどのように異なる広がりを見せるかを示しています。周波数が低いほど (スピーカーの背後でも、180°) 大きく広がり、より高い周波数は指向性が強くなることを示しています。
スピーカー感度
スピーカーの感度とは、一定のパワーを供給したときに音を再生する能力のことです。感度は、1W (通常、1kHz) の音声信号を供給し、1mの距離における音圧レベルをdBSPL単位で測定することによって求めます。一般的なスピーカーの感度は85~92dBSPL程度であり、感度が高ければ高いほど、ある一定の電力を供給したときにスピーカーから出る音が大きくなります。
通常、アナログスピーカーの場合、スピーカーの感度はスピーカーの品質を示す指標になります。感度が低いほど、磁石の磁力が弱かったり、より小さくて安いコイルを使用したりしていることを示します。したがって、音質について言えば、10インチのスピーカーが8インチのスピーカーより優れているとは必ずしも言えないのです。
しかし、デジタルスピーカーの場合は、アンプがスピーカーに内蔵されています。スピーカーの感度測定は、スピーカーの品質を特定するための重要な要素ではなくなりました。
内蔵デジタルシグナルプロセッサー
すべてのAxisスピーカーは、アンプとデジタルシグナルプロセッサー (DSP) を内蔵し、あらかじめ設定された音質を実現しています。これにより、オーディオの専門家に頼らなくても誰でもスピーカーを使用して良い音を出せます。DSPは音声信号を分析・処理し、音声の明瞭度を向上させます。
内蔵DSPにより、Axisスピーカーはバックグラウンドノイズをフィルタリングし、音声周波数のバランスを調整し、音質を向上させます。また、音声信号のダイナミックレンジも圧縮します。音声信号はしばしば音量にピークや谷がありますが、ダイナミックレンジコントロールはこれらのバランスをとることで、リスナーにとって理想的な音量で音が放送されるようにします。
DSPは、小音量では人間の耳に感じにくい小さな音を補正します。リスナーの聞き逃しが起きないように、こうした音の周波数をブーストします。さらに、ソースからスピーカーまで音声をデジタル的に処理、保存、伝送します。これにより音質が向上し、信号強度が維持されるため、スピーカーに最適化されたサウンドが実現されます。BGMと音声のサウンドプロファイルはあらかじめ定義されているので、手動で音声品質を制御する必要はありません。
スピーカーの種類
フォームファクター、音圧、取り付け方にはさまざまなものがあります。騒音の多い屋外で明瞭な聞き取りやすいアナウンスを伝えるのに最適なスピーカーもあれば、狭い空間での使用に優れたスピーカーもあります。

ハイファイスピーカー
ハイファイ機器では、いわゆる「2ウェイ」や「3ウェイ」のスピーカーが一般的です。こうしたスピーカーは、20Hzから20kHzの間のできるだけ広い周波数を正確に再生するために、複数の異なるスピーカードライバーを使用しています。1つのドライバーは500Hzまでの音域の再生を担当し、2つ目のドライバーは500Hzから9kHzまでの周波数の再生を担当し、3つ目のドライバーは9kHzを超える周波数の再生を担当するようにできます。こうした境界周波数は「クロスオーバー周波数」と呼ばれます。ハイファイスピーカーは、大音量でも非常に正確に音声を再生するように設計されています。
ホーンスピーカー
ホーンスピーカーはハイファイスピーカーとは用途がまったく異なり、広い周波数帯域をカバーさせるものではありません。このスピーカーの目的は、メッセージ (人間の声やサイレンなど) をできるだけ明瞭に伝えることができるように、人間の耳の感度が最も高い周波数の音量を最大にすることです。このホーンは、音を一方向に向けることで、音圧をさらに高めます。

多目的スピーカー
多目的スピーカーは統合が容易であり、ライブまたはあらかじめ録音された音声メッセージで安全手順を伝えたり、侵入者に警告を発したりできるオールインワンソリューションです。多目的スピーカーは、BGMの再生にも使用できます。Axisのポートフォリオにはさまざまな多目的スピーカーがあります。
キャビネットスピーカー
Axisネットワークキャビネットスピーカーは中程度の音圧レベルを提供します。ほとんどの屋内エリアで使用できますが、非常に騒音の多い環境では最適と言えません。また半屋外でも使用できるので、屋根の下に取り付けると大雨から保護することができます。壁、天井、または吊下げキットを使用すると、縦向きや横向きに取り付けることができます。

シーリングスピーカー
Axisネットワークシーリングスピーカーは、中程度の音圧レベルを特徴としています。病院、小売店、オフィスビルなど、騒音の少ない、屋内または屋外エリアで使用することをお勧めします。吊り天井に取り付けることが可能です。ほとんど目立たないので、環境にうまく適応させることができます。

ペンダントスピーカー
Axisネットワークペンダントスピーカーの音圧レベルは中程度で、天井の高い騒音の少ない屋内エリアに適しています。サイズは2種類あり、ケーブルの長さはどのような高い天井にも合うように調節できます。

ミニスピーカー
Axisネットワークミニスピーカーは音圧レベルが低いため、静かな屋内で使用する必要があります。小型で目立たないため、小さなスペースや通路にフィットし、壁や天井の表面に取り付けることが可能です。 また、音声範囲が広いため、必要なスピーカーの台数が少なくなります。ミニスピーカーは、動体検知用のPIRセンサーを内蔵しているため、誰かが近づいているときに音声メッセージを自動再生するように設定することができます。

サウンドプロジェクター
Axisネットワークサウンドプロジェクターは、高い音圧レベルと自然で豊かなサウンドを実現します。これはメッセージを可能な限り明瞭に伝えつつ、BGMも良い音で鳴らせることを意味します。サウンドプロジェクターは屋外設置や騒音の多い屋内エリアで使用でき、ポール、壁、天井に取り付けることができます。手が届きやすく破壊行為のリスクが高い場所にも設置できます。サウンドプロジェクターは耐衝撃性があり、環境に簡単に溶け込む洗練されたミニマルなデザインです。
スピーカーの配置
スピーカーにはさまざまな配置方法があります。一般的なルールとしては、可能であれば、常に部屋に沿って音を向けることが挙げられます。たとえば、部屋が長方形であれば、短い辺の壁にスピーカーを配置して、長い辺の壁に沿って向けるようにします。こうすることで、壁に反射する前に音が可能な限り広がります。ただし、スピーカーを隅に配置すると、低音が不均一に増幅されるため、お勧めできません。
クラスター配置
シンプルで低コストの設置を優先する場合は、スピーカーをクラスターで設置することができます。これでケーブルの配線作業は最小限に抑えられますが、良好な音の広がりを得る最良の方法ではない可能性があります。
壁面配置
部屋の寸法で許容され、余分なケーブルを気にしない場合、壁面配置ソリューションはおそらくより良好な音の広がりを得ることができます。クラスター配置の例と同じ数のスピーカーを使用すると、設置は下図のようになります。ただし、部屋が広い場合は、スピーカーの到達距離が短すぎる可能性があります。
天井への配置
部屋が吊り天井の場合、または埋め込み型天井スピーカーを設置することが可能な場合は、天井配置が、目立たないソリューションです。しかし、これは天井の高さにより大きな影響が発生します。天井が低いと、特定の領域をカバーするために、より多くのスピーカーが必要となります。
AXIS Site Designer
AXIS Site Designer (https://sitedesigner.axis.com) は、どのスピーカーを使用するか、何台のスピーカーが必要か、どのように配置するのが最適かなど、設置場所の状況に応じたオーディオ設置(およびビデオ設備)の計画と設計に役立つオンラインツールです。