マイクロフォンの位置を決定するための方法及び機器

著者らは特許

G01S5/28 - 相異なる形,例.双曲線状,円形,楕円形または放射状,の位置線を組み合わせることによるもの
H04S - ステレオ方式
H04S7/00 - 指示装置;制御装置,例.バランス制御

の所有者の特許 JP2016517679:

コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V.

 

機器が、第1の位置にある第1のスピーカ101及び第2の位置にある第2のスピーカ103のそれぞれによるレンダリングのための2つのチャネルを含む、マルチチャネル信号を受け取る受信器203を含む。そのマルチチャネル信号から、第1の信号生成器207が相関信号を生成し、第2の信号生成器209が無相関信号を生成し、それらの信号はチャネルの相関信号成分及び無相関信号成分をそれぞれ含む。受信器201が、マイクロフォン107からマイクロフォン信号を受け取る。第1の相関器213が、マイクロフォン信号と相関信号との相関から第1の相関信号を決定し、第2の相関器215が、マイクロフォン信号と無相関信号との相関から第2の相関信号を決定する。位置推定器219が、第1の相関信号及び第2の相関信号からマイクロフォンの位置を推定する。例えば伝搬遅延、従ってスピーカ101、103からの距離を決定するために、相関信号内のピークのタイミングが使用されても良い。

 

 

本発明は、マイクロフォンの位置を決定するための方法及び機器に関し、具体的には、これだけに限定されないがスピーカ較正操作の一環としてマイクロフォンの位置を決定するための方法及び機器に関する。
ここ数十年間、例えば多岐にわたるオーディオ及び捕捉レンダリングの応用が大いに変わったことにより、オーディオ応用の多様性及び柔軟性が大いに高まった。音声のレンダリング及び捕捉の設定が、多岐にわたる音響環境内で及び多くの異なる応用例で使用される。
従って多くの応用例で、マイクロフォン、聴取位置、又は他のラウドスピーカに対するラウドスピーカの位置を決定できることが望ましい。多くの応用例で、これらの問題は同じ根本的問題、つまりマイクロフォンの位置決定の問題に要約され得る。
実際に多くの応用例で、聴取位置に配置されるマイクロフォンを使用してシステムを較正することによって聴取位置が決定され得る。同様に、マイクロフォンをスピーカの位置に配置することにより、又は場合によりマイクロフォンをラウドスピーカの中に永続的に実装することにより、スピーカの位置が決定され得る。多くの応用例において特に重要な課題は、サラウンドサウンドシステム等のレンダリング設定用のラウドスピーカの位置を決定する課題である。
実際に、例えばホームシネマサラウンドサウンドを使用する時に消費者によって知覚される著しい不都合は、比較的多数のスピーカが特定の位置に配置されなければならないことである。典型的には、スピーカを最適位置に配置することを実用的でないと利用者が思うことにより、実際のサラウンドサウンドスピーカの設定が理想的な設定から逸脱する。従って、実際の設定が理想的な設定から大いに逸脱し、よってレンダリングシステムを較正するための、及び不完全性を補償するための手順が開発されている。システムが音声処理及びレンダリングを特定の設定に合わせて自動で調節しながら、利用者が比較的自由に都合の良い位置にスピーカを配置することができる柔軟な設定を実現するための、スピーカの較正に基づく柔軟なシステムが開発されている。
かかるシステムは、スピーカの相対位置を決定することに基づき得る。例えば、国際公開第2006/131893−A1号は、ペアのラウドスピーカの各組合せからインパルス応答が決定されることを可能にするマイクロフォンを各ラウドスピーカが備えるシステムに基づく、マルチチャネルシステムの自動較正を開示する。次いで、その情報はラウドスピーカの相対位置を決定するために使用される。次いで、指定の聴取位置において、ITU−R BS.775−1推奨規格内で規定されている最適なリスニングエクスペリエンスが得られるように、マルチチャネル音声信号を分散させるために最適化手法が使用される。米国特許第5666424−A号では、各ラウドスピーカから聴取位置までの相対距離を決定するために聴取位置にあるマイクロフォンを使用する較正手順が実行される。
既存のレンダリング較正は概して、ノイズシーケンス又はチャープ音等の特定の試験信号又はプローブ信号をラウドスピーカがレンダリングし、その結果生じる信号がマイクロフォンによって捕捉されることに基づく。かかるシステムの較正には数秒かかる場合がある。より重要なことに、このプロセスは特定の音声試験信号に依存し、従って音楽の再生中等、オーディオシステムの通常動作中に実行することができない。
しかし、音楽のレンダリング中等、レンダリングシステムの通常使用中に位置を決定できることが望ましい。そのように位置を決定できることは、システムの継続的適応を可能にする決定の改善を概してもたらすことができる。例えば、再生中に利用者がスピーカを移動することに合わせてシステムが自動で適応することができる。この特徴は、人気が高まりつつある携帯型のフルワイヤレス電池式ラウドスピーカを使用する多くの現行の及び将来のシステムにおいて特に重要であり得る。
しかし、特定の瞬間特性が予測不能であることにより、通常の音声は著しく変化する傾向がある。従って、かかる信号に基づく位置推定は、多くの場合比較的信頼できない推定値をもたらす傾向がある。更に、異なるラウドスピーカからの信号は互いに異なる傾向があるが、任意の所与の時点におけるその違いは、分からない。
従って、マイクロフォンの位置を決定するための改善された手法が有利であり、具体的には、柔軟性の改善、自動決定、特定の試験信号への依存の低減、推定精度の改善、及び/又は性能の改善を可能にする手法が有利であろう。
従って本発明は、好ましくは上記の不都合の1つ又は複数を単独で若しくは任意の組合せで軽減し、緩和し、又は無くそうとするものである。
本発明の一態様によれば、マイクロフォンの位置を決定するための機器が提供され、この機器は、第1の位置にある第1のスピーカによるレンダリングのための第1のチャネル及び第2の位置にある第2のスピーカによるレンダリングのための第2のチャネルを少なくとも含む、マルチチャネル信号を受け取るためのマルチチャネル信号受信器と、マルチチャネル信号から第1の相関性信号を生成するための第1の信号生成器であって、第1の相関性信号は第1のチャネル及び第2のチャネルの相関性信号成分を含む、第1の信号生成器と、マルチチャネル信号から第1の無相関性信号を生成するための第2の信号生成器であって、第1の無相関性信号は第2のチャネルの信号成分と相関性の無い第1のチャネルの信号成分を含む、第2の信号生成器と、マイクロフォンからマイクロフォン信号を受け取るためのマイクロフォン信号受信器と、マイクロフォン信号と第1の相関性信号との相関から第1の相関信号を決定するための第1の相関器と、マイクロフォン信号と第1の無相関性信号との相関から第2の相関信号を決定するための第2の相関器と、第1の相関信号及び第2の相関信号に応じてマイクロフォンの位置を推定するための位置推定器とを含む。
本発明は多くのシナリオ及び応用例において、マイクロフォンの位置の決定を改善し且つ/又は容易にすることを可能にし得る。この手法は、特定の試験信号を必要とすることなしに位置を決定できるようにし、多くのシナリオにおいて、音楽又はサウンドトラックに相当する音声のレンダリング中等、通常動作中の音声レンダリングの測定値に基づいてマイクロフォンの位置を決定できるようにし得る。
マイクロフォンの位置は、聴取位置又はスピーカの位置に関係し得る。特にこの機器は、一部の実施形態では、決定された位置に応じてオーディオシステムの較正を行うように構成されても良く、とりわけマイクロフォンの位置が聴取位置又はスピーカの位置に対応するという仮定に基づいてかかる較正を行うことができる。
相関の信号間の様々な時間オフセットに関する相関値を与えるように、相関信号が生成され得る。相関信号は、関数を計算するために使用される信号間の様々な時間オフセットに関する相関値をもたらすために生成される相関関数とすることができる。従って、第1の相関信号は時間の関数として相関値を与えることができ、所与の時点の相関値は、その時点に対応する時間オフセットに関するマイクロフォン信号と第1の相関信号との間の相関に対応する。同様に、第2の相関信号は時間の関数として相関値を与えることができ、所与の時点の相関値は、その時点に対応する時間オフセットに関するマイクロフォン信号と第1の無相関性信号との間の相関に対応する。相関信号は、とりわけ信号のペア間の相互相関であり得る。
第1の相関信号及び第2の相関信号は、第1のスピーカ及び第2のスピーカからマイクロフォンへの音響伝達関数のインパルス応答を反映することができる。
一部の実施形態では、位置推定器が、第1のスピーカ及び第2のスピーカからの様々な伝搬遅延に対応する時点における第1の相関信号及び第2の相関信号の振幅に応じて位置を決定することができる。
一部の実施形態では、位置推定器が第1の相関信号及び第2の相関信号内のピークのタイミングに応じて位置を決定することができる。ピークとは、(典型的には適切なフィルタリング又は平均化を伴う)相関信号の極大であり得る。
本発明の任意選択的特徴によれば、この機器が、マルチチャネル信号から第2の無相関性信号を生成するための第3の信号生成器であって、第2の無相関性信号は第1のチャネルの信号成分と相関性の無い第2のチャネルの信号成分を含む、第3の信号生成器と、マイクロフォン信号と第2の無相関性信号との相関から第3の相関信号を決定するための第3の相関器とを更に含み、第3の相関信号に更に応じてマイクロフォンの位置を推定するように位置推定器が構成される。
これにより、多くの実施形態において位置推定の改善を実現することができ、生成される位置推定の精度の改善、従ってオーディオレンダリングシステムの較正等の関連操作の精度の改善をもたらすことができる。
本発明の任意選択的特徴によれば、位置推定器が、第1の相関信号に応じて第1のスピーカ及び第2のスピーカからマイクロフォンへの音声の第1の到達時間推定値及び第2の到達時間推定値を生成するための第1の推定器と、第1の無相関性信号に応じて第1のスピーカからマイクロフォンへの音声の第3の到達時間推定値を生成するための第2の推定器とを含み、第1の到達時間推定値、第2の到達時間推定値、及び第3の到達時間推定値に応じてマイクロフォンの位置を推定するように位置推定器が構成される。
これにより、多くの実施形態において位置推定の改善及び/又は円滑化を実現することができる。
第1の到達時間推定値及び第2の到達時間推定値は、第1のスピーカ及び第2のスピーカから位置/マイクロフォンへの伝搬遅延に対応し得る。しかし、第1の到達時間推定値が第1のスピーカに対応するのか第2のスピーカに対応するのかが分からない場合があり、第2の到達時間推定値についても同様である。第3の到達時間推定値は、第1のスピーカから位置/マイクロフォンへの伝搬遅延に対応し得る。
第3の到達時間推定値は、第1の到達時間推定値又は第2の到達時間推定値の何れか一方に基づく推定値に加え、第1のスピーカから位置への伝搬遅延の更なる推定値をもたらすことができる。従ってこの手法は、到達時間/伝搬遅延の複数の推定値をもたらすことができ、それにより精度の改善を可能にする。
一部の実施形態では、第3の推定器が、第2の無相関性信号に応じて第2のスピーカからマイクロフォンへの音声の第4の到達時間推定値を生成することができ、第4の到達時間推定値に応じて位置推定器が位置を更に決定することができる。
本発明の任意選択的特徴によれば、位置推定器が、第3の到達時間推定値に応じて第1のスピーカ及び第2のスピーカの一方に第1の到達時間推定値を割り当てるように構成される。
これにより、効率的且つ高信頼の位置決定が可能になり得る。特に、第1の到達時間推定値及び第2の到達時間推定値のどちらが第1のスピーカからの音声に対応し、どちらが第2のスピーカからの音声に対応するのかが分からないことがある。第1のスピーカに属することが分かっている第3の到達時間推定値に基づき、この曖昧さ及び不確実性が解決され得る。
一例として、第1の到達時間推定値及び第2の到達時間推定値のうちの第3の到達時間推定値に最も近い到達時間推定値が第1のスピーカに対応すると見なされ、他方が第2のスピーカに対応すると見なされ得る。
とりわけ位置推定器は、第1の到達時間推定値が割り当てられていない第1のスピーカ及び第2のスピーカの一方に第2の到達時間推定値を割り当てるように構成され得る。従って、第1の到達時間推定値及び第2の到達時間推定値が、第3の到達時間推定値に基づいて第1のスピーカ及び第2のスピーカに必要に応じて割り当てられ得る。
本発明の任意選択的特徴によれば、位置推定器が、第3の到達時間推定値、並びに第1の到達時間推定値及び第2の到達時間推定値のうちの1つから第1のスピーカの音声の複合到達時間推定値を決定し、複合到達時間に対応する第1のスピーカからの距離を有するようにマイクロフォンの位置を決定するように構成される。
これにより、多くのシナリオにおいて操作の円滑化及び/又は性能の改善がもたらされ得る。
第1の到達時間推定値及び第2の到達時間推定値のうちの選択されるものは、とりわけ第3の到達時間推定値に最も近い推定値であり得る。
本発明の任意選択的特徴によれば、複合到達時間推定値を生成する際の第3の到達時間、並びに第1の到達時間推定値及び第2の到達時間推定値のうちの1つの相対的な重み付けが、第1の相関及び第2の相関の少なくとも一方に関する相関レベル推定値及び相関雑音推定値の少なくとも1つに依存する。
これにより、多くのシナリオにおいて位置推定の改善を実現することができ、とりわけレンダリングされる音声の特定の特性に対する適応の改善をもたらすことができる。とりわけかかる重み付けは、2つのチャネルの信号がどの程度同じか、又はどの程度異なるのかに応じて位置推定が適応されることを可能にし得る。この手法は、決定に関する信号対雑音比の改善を実現することができ、結果として生じる位置推定の雑音/不確実性の低減をもたらし得る。
本発明の任意選択的特徴によれば、第1の推定器が、第1の相関信号内の第1のピーク及び第2のピークを検出し、第1のピークのタイミングに応じて第1の到達時間推定値を決定し、第2のピークのタイミングに応じて第2の到達時間推定値を決定するように構成される。
これにより、操作の円滑化及び/又は推定の改善がもたらされ得る。ピーク検出は、例えば適切なフィルタリング後に相関信号内の極大を検出することであり得る。
本発明の任意選択的特徴によれば、第1の推定器が、第1の相関信号内のピークを検出するためにピーク検出を実行し、ピークのタイミングに応じて第1の到達時間推定値を決定するように構成され、ピーク検出は第2の相関信号に依存する。
これにより、操作の円滑化及び/又は推定の改善がもたらされ得る。ピーク検出は、例えば適切なフィルタリング後に相関信号内の極大を検出することであり得る。ピーク検出は、例えば第3の相関信号内のピークのタイミングに基づき、第1の相関信号内のピークを検出する時間間隔を選択することによって調節され得る。
本発明の任意選択的特徴によれば、位置推定器が、第2の相関信号のパワー測度に対する第1の相関信号のパワー測度、及び第1の無相関性信号の測度レベルに対する第1の相関性信号のパワー測度のうちの少なくとも1つに応じて、第2の相関信号に対して第1の相関信号に重み付けするように構成される。
これにより、多くのシナリオにおいて位置推定の改善をもたらすことができ、具体的にはレンダリングされる音声の特定の特性に対する適応の改善を実現することができる。とりわけかかる重み付けは、2つのチャネルの信号がどの程度同じか、又はどの程度異なるのかに応じて位置推定が適応されることを可能にし得る。この手法は、決定に関する信号対雑音比の改善を実現することができ、結果として生じる位置推定の雑音/不確実性の低減をもたらす。
相対的パワーレベルは、例えば極大付近の時間間隔等、或る時間間隔内で測定され得る。
本発明の任意選択的特徴によれば、位置推定器が、第1の時間間隔内の第1の相関信号の特性及び第2の時間間隔内の第2の相関信号の特性の少なくとも1つに応じて或る領域内に位置がある確率を決定するように構成され、第1の時間間隔及び第2の時間間隔は、第1のスピーカからその領域までの音声に関する音声伝搬遅延に対応する。
これにより、特に有利な位置決定を実現することができ、特に追加の位置情報をもたらすことができる。
一部の実施形態では、複数の領域の確率を決定するように位置推定器が構成され得る。例えば一部の実施形態では、マイクロフォンの位置が、最も高い確率を有する領域の位置として選択され得る。一部の実施形態では、或る区域を複数の領域に分割し、領域毎に確率を決定することによってその区域の確率マップが決定され得る。
本発明の任意選択的特徴によれば、特性が信号レベル測度である。
これにより、多くの実施形態において特に有利な位置決定を実現することができる。
信号レベル測度は、絶対的な又は相対的な信号レベル測度であり得る。
本発明の任意選択的特徴によれば、この機器が、第1のチャネルの第1のチャネル信号を複数の時間周波数間隔に分けるように構成される分割器と、複数の時間周波数間隔の時間周波数間隔毎に、第1のチャネルの第1のチャネル信号及び第2のチャネルの第2のチャネル信号の相関測度を生成するための相関推定器とを更に含み、第1の信号生成器は、時間周波数間隔毎に、その時間周波数間隔の第1のチャネル信号の信号値に対して時間周波数間隔に関する相関測度の単調増加関数である重みによって重み付けすることにより、第1の相関信号を生成するように構成される。
これにより、相関性信号を生成するためのとりわけ有利な手法がもたらされ得る。具体的には、この手法は、チャネル間で高度に相関性がある音声成分、及び高度に相関性がない音声成分の効率的な分離を実現することができる。
本発明の任意選択的特徴によれば、第2の信号生成器が、時間周波数間隔毎に、その時間周波数間隔の第1のチャネル信号の信号値に対して時間周波数間隔に関する相関測度の単調減少関数である重みによって重み付けすることにより、第1の無相関性信号を生成するように構成される。
これにより、第1の無相関性信号を生成するためのとりわけ有利な手法がもたらされ得る。具体的には、この手法は、チャネル間で高度に相関性がある音声成分、及び高度に相関性がない音声成分の効率的な分離を実現することができる。
本発明の一態様によれば、マイクロフォンの位置を決定する方法が提供され、この方法は、第1の位置にある第1のスピーカによるレンダリングのための第1のチャネル及び第2の位置にある第2のスピーカによるレンダリングのための第2のチャネルを少なくとも含む、マルチチャネル信号を受け取るステップと、マルチチャネル信号から第1の相関性信号を生成するステップであって、第1の相関性信号は第1のチャネル及び第2のチャネルの相関性信号成分を含む、ステップと、マルチチャネル信号から第1の無相関性信号を生成するステップであって、第1の無相関性信号は第2のチャネルの信号成分と相関性の無い第1のチャネルの信号成分を含む、ステップと、マイクロフォンからマイクロフォン信号を受け取るステップと、マイクロフォン信号と第1の相関性信号との相関から第1の相関信号を決定するステップと、マイクロフォン信号と第1の無相関性信号との相関から第2の相関信号を決定するステップと、第1の相関信号及び第2の相関信号に応じてマイクロフォンの位置を推定するステップとを含む。
本発明のこれらの及び他の態様、特徴、及び利点が、以下に記載の実施形態から明らかになり、それらを参照して説明される。
本発明の実施形態が専ら例として以下の図面に関して説明される。
本発明の一部の実施形態による音声レンダリングシステムの説明図である。 本発明の一部の実施形態による、音声レンダリングシステム用の位置推定ユニットの説明図である。 図2の位置推定ユニットによって計算され得る相互相関信号の一例を示す。 図2の位置推定ユニットによって計算され得る相互相関信号の例を示す。 位置確率マップの一例を示す。 図2の位置推定ユニットの信号分解器の要素の一例を示す。
以下の説明は、空間音響レンダリングシステムの較正で用いるマイクロフォンの位置を決定するためのシステムに適用可能な本発明の実施形態に焦点を当てる。但し、本発明はこの応用例に限定されず、他の多くの応用例に適用され得ることが理解される。
以下の説明は、図1に示されている音声レンダリング構成に焦点を当てる。この例では、音声レンダリング構成が第1のラウドスピーカ101及び第2のラウドスピーカ103を含む。この具体例では、第1のラウドスピーカ101及び第2のラウドスピーカ103がステレオレンダリングシステムのスピーカであり、それぞれ左スピーカ及び右スピーカとも呼ばれる。
この具体例では、システムが2チャネル(ステレオ)レンダリングシステムである。但し、他の実施形態では、本システムが3つ以上のチャネルを含むマルチチャネルシステムであり得ることが理解される。とりわけ第1のスピーカ101及び第2のスピーカ103は、例えば正面の左右のスピーカ等、5個又は7個の空間スピーカを含むサラウンドサウンドシステムの2つのスピーカであり得る。
第1のスピーカ101及び第2のスピーカ103は、スピーカ101、103用の駆動信号を生成するように構成される音声レンダラ105に結合される。このレンダリングシステムは、例えば音楽を再生するために、例えばテレビ、映画等のサウンドトラックを提供するために使用され得る。一部の実施形態では、このレンダリングシステムは、第1のスピーカ101及び第2のスピーカ103よりも多くを含むサラウンドサウンドシステムであり得る。例えばこのレンダリングシステムは、空間チャネルの2つに、とりわけ正面の左右のチャネルに第1のスピーカ101及び第2のスピーカ103を使用し、5.1又は7.1フルサラウンドサウンドエクスペリエンスを提供することができる。
音声レンダリングを最適化するために、特定のレンダリング特性に対してシステムを較正/適応することが望ましい。多くのシナリオにおいて、スピーカの位置又は聴取区域の位置等の特定の位置を決定することが望ましい。一部のシステムでは、かかる位置がマイクロフォンを使用して決定され得る。従って、知られていることが望ましい位置にマイクロフォンが配置され得る。例えばマイクロフォンは、典型的な聴取位置に配置されても良く、又はスピーカと一緒に配置されても良い(リアサラウンドスピーカ等)。次いで、マイクロフォンの位置が例えば特定のスピーカの位置に対して決定されても良く、決定された位置はレンダリングシステムを較正する際に使用され得る。
図1のシステムでは、音声レンダラ105は、外部のマイクロフォン107が結合され得るマイクロフォン入力を含む。受け取られるマイクロフォン信号に基づき、音声レンダラ105は、第1のスピーカ101及び第2のスピーカ103に対するマイクロフォン107の位置を決定することができる。決定されたマイクロフォンの位置は、次いで、例えば別のスピーカの位置又は聴取位置として使用され得る。例えば、利用者はまず、マイクロフォン107をリアスピーカの位置(図1の位置Aで示す)に配置することができる。次いでその位置が決定され、リアスピーカの位置として使用され得る。次いで利用者は、マイクロフォンを聴取位置(図1の位置Bで示す)に移動し、その位置が決定され、聴取者の位置として使用され得る。他の実施形態では、複数のマイクロフォン及び入力が使用されても良い。例えば、マイクロフォンが(変化し得る)好ましい聴取位置に継続的に配置され、リアスピーカと一体化されても良い。その後、音声レンダラ105が、リアスピーカ及び聴取者の現在位置を継続的且つ同時に決定し、それに応じてレンダリングを動的に更新することができる。
例えばシステムを較正するためにマイクロフォンの位置を決定するための機能を含む殆どのレンダリングシステムは、システムのスピーカによってレンダリングされる特定の試験信号を利用する。従って、それらの試験信号をマイクロフォンが検出し、位置を決定するために対応する捕捉信号が使用される。しかし、通常動作中に決定が行われることを妨げるため、このシステムは最善ではない。
図1のシステムは、マイクロフォン107の位置を決定するように構成されるが、専用の試験信号を必要としない。むしろこのシステムは、通常のレンダリング動作中にマイクロフォンの位置が決定されることを可能にする。位置の決定は、例えば音楽又は映画のサウンドトラック等の通常のレンダリング音声を使用して実行される。この手法は、特定の較正/試験手順の必要性を除去できるため、利用者に便利さを与えることができるだけでなく、動作中のシステムの改善された及び継続的な適応も可能にすることができる。
図1の音声レンダラ105は、とりわけマイクロフォン107の位置(又は複数のマイクロフォンが同時に使用される実施形態及びシナリオでは複数のマイクロフォンの位置)を推定するように構成される位置推定ユニットを含む。位置推定ユニットは、ラウドスピーカからの捕捉音声信号に基づいて位置を決定するように構成され、特に例えば音楽又はサウンドトラックに基づいて、及びレンダリングされる音声の特定の性質についての如何なる特定の事前知識も必要とすることなしに位置を決定することができる。
位置の推定は、第1のスピーカ101及び第2のスピーカ103の信号に関する相関性信号成分及び無相関性信号成分を生成することに基づく。マイクロフォンによって捕捉される音声に対してこれらの信号が比較され、その結果がマイクロフォンの位置を決定するために使用される。
相関性信号成分は、2つのチャネル/スピーカ101、103に共通の信号成分に対応する一方で、無相関性信号成分は2つのチャネル/スピーカ101、103に共通しない信号成分に対応する。
位置推定ユニットは、受け取られるマイクロフォン信号を少なくとも1つの相関性信号及び少なくとも1つの無相関性信号と相関させ、それらの少なくとも2つの相関に基づいてマイクロフォン107の位置を推定するように構成される。従ってこの手法は、レンダリングされる音声信号から得られる少なくとも2つの異なる信号との相関を利用する。この2つの相関は、位置を決定する際に組み合わせられ得る様々な利点をもたらす。とりわけ、レンダリングされる音声の共通の/相関性のある信号成分に基づく相関は、しばしば高い信号対雑音エネルギ(signal to noise energy)を有する傾向にあり、それにより正確な推定を可能にする。しかし、相関が共通の信号成分に基づくため、2つのチャネル/第1のスピーカ101及び第2のスピーカ103からの音声の区別及び分離が容易には実現できず、即ち2つのスピーカ101、103のそれぞれからの寄与度を決定できない可能性がある。対照的に、無相関性信号との相関は、スピーカ101、103の1つに関するそれぞれの特性を与えるが、しばしば低い信号対雑音比を有し、それにより精度の低下を招くことがある。これらの異なる手法を組み合わせることにより、マイクロフォンの位置推定が相関のそれぞれの利点を提供できることが多く、多くの実施形態において、推定位置の精度及び信頼性の改善をもたらし得る。例えば、相関信号に基づく相関内の2つのスピーカ101、103間の曖昧さを解決するために、無相関性信号成分に基づく相関が使用され得る。
或る手法は、例えば入力ステレオ信号との間で相関性のある及び相関性の無い信号成分に対応する信号に、ステレオ音声信号が分解され得るという原理に基づくことができる。更に、相関性信号成分及び無相関性信号成分は、2つの異なる位置測定アルゴリズム内で使用されても良く、汎用ステレオ音声信号からのレンダリングに基づきマイクロフォンの位置を見つけるために2つの方法の結果が融合されても良い。
図2は、この具体例では図1の音声レンダラの一部である位置推定ユニットの要素の一例を示す。
位置推定ユニットは、マイクロフォン107からマイクロフォン信号を受け取るように構成されるマイクロフォン受信器201又は入力を含む。一部の実施形態では、マイクロフォン受信器201が複数のマイクロフォン信号を同時に受信するように構成され得る。以下の説明は、マイクロフォンからのマイクロフォン信号に基づき、1つのマイクロフォンの位置推定を決定することに焦点を当てる。しかし、他の実施形態では、複数のマイクロフォンの位置推定を決定するために、説明される処理が例えば複数のマイクロフォン信号について同時に実行され得ることが理解されよう。
位置推定ユニットは、マルチチャネル信号を受け取るマルチチャネル信号受信器203を更に含む。マルチチャネル信号は、第1の位置に配置される第1のスピーカ101によるレンダリングのための第1のチャネル(信号)を含む。マルチチャネル信号は、第2の位置に配置される第2のスピーカ103によるレンダリングのための第2のチャネル(信号)も含む。
一部の実施形態では、マルチチャネル信号が、リアサラウンドスピーカ用のチャネル等、他のチャネルを含み得る。以下の説明は、正面の左右の(又は従来のステレオ)チャネルに対応する第1のチャネル及び第2のチャネルに基づき、マイクロフォン107の位置推定を決定することに焦点を当てるが、他の実施形態では更に多くの又は他のチャネルが検討され得ることが理解されよう。例えば5チャネルサラウンドサウンドシステムでは、説明される手法がチャネル/スピーカの幾つかの又はそれぞれのあり得るペアリングに使用され得る。かかる一部の実施形態では、様々なスピーカの対に関して求められるそれぞれの位置推定を例えば平均化処理によって組み合わせることにより、単一の位置推定が決定され得る。
この例では、音声レンダラ105が第1のスピーカ101及び第2のスピーカ103用の駆動信号を生成し、それらをマルチチャネル信号受信器203に与える。第1のチャネル及び第2のチャネル、従って第1のスピーカ101及び第2のスピーカ103に対応する信号は、信号経路内のどこから与えられても良く、例えば、2つのスピーカ101、103からレンダリングされる音声のフィルタ済みの又は他の方法で修正された表現であり得る。第1のチャネル及び第2のチャネルの信号は、便宜上入力ステレオ信号と呼ばれ、それぞれの信号は(第1のスピーカ101の信号に対応する)左入力信号及び(第2のスピーカ103の信号に対応する)右入力信号と呼ばれる。
マルチチャネル信号受信器203は、第1のチャネル及び第2のチャネルの相関性信号成分(即ちこの信号は左右の入力信号の相関性信号成分を含む)と、第1のチャネル及び第2のチャネルの無相関性信号成分を含む少なくとも1つの信号(即ちこの信号は左右の入力信号の無相関性信号成分を含む)とを含む、少なくとも1つの信号を生成するように構成される分解器205に結合される。相関性信号成分を含む信号は相関性信号と呼ばれ、無相関性信号成分を含む信号は無相関性信号と呼ばれる。
この具体例では、分解器205が、左右の入力信号の共通の信号成分を含む相関性信号を生成する第1の信号生成器207を含む。分解器205は、右の入力信号の信号成分と共通ではない左の入力信号の信号成分に対応する第1の無相関性信号を生成する第2の信号生成器209を更に含む。第1の無相関性信号は、左の無相関性信号と呼ばれる。この例では、分解器205が、左の入力信号の信号成分と共通ではない右の入力信号の信号成分に対応する第2の無相関性信号を生成する第3の信号生成器211も含む。第2の無相関性信号は、右の無相関性信号と呼ばれる。
入力ステレオ信号はx(n),x(n)として示すことができ、この例では相関性信号c(n)と左右の無相関性信号u(n)、u(n)とに分解され、次式

が成立し、十分長い観測窓にわたる相互相関関数が次式をもたらす。

単純な実施形態では、信号を時間単位で相関性部分と無相関性部分とに分割することによって分解が行われ得る。短い観測窓の中で2つの信号が低い(正規化された)相互相関係数(例えば0.6未満)を有する場合、その信号は無相関性信号として分けられる。2つの信号間の正規化された相互相関が或る既定の閾値(例えば0.9)を上回る場合、ステレオ信号が相関信号として分割される。この場合、元のステレオ信号の分解は、無相関性区分、相関性区分、及び省かれる(0.6〜0.9の)軽度相関性区分を変更することから成る。閾値は例に過ぎない。
一部の実施形態では、分解は、或るチャネルの相関性信号と無相関性信号との和がそのチャネルの入力信号と同一であるものとすることができ、即ち次式が成立する。
(n)=c(n)+u(n);x(n)=c(n)+u(n)
しかし他の実施形態では、これらの等式がおおよそしか当てはまらない場合がある。従って一部の実施形態では、
(n)=c(n)+u(n)+e(n);x(n)=c(n)+u(n)+e(n)
が成立し、但しe(n)、e(n)は、分解の誤差又はずれと見なされても良く、例えば上記の例ではこれらの信号は軽度相関性区分を表すであろう。典型的には、分解の誤差又はずれは比較的小さく、例えば平均パワーが対応する入力信号の平均パワーの10%を超えることはない。
第1の生成器207は、無相関性信号を受け取る第1の相関器213に結合される。第1の相関器213は、マイクロフォン信号の受け取り先であるマイクロフォン受信器201に更に結合される。第1の相関器213は、無相関性信号とマイクロフォン信号との間の相関に応じて第1の相関信号を生成するように構成される。相関信号は、とりわけ下記の相互相関関数:

として与えられても良く、但しTは適切な設計パラメータであり、相関信号が決定される時間間隔を示し、m(t)はマイクロフォン信号である。
多くの実施形態において、信号のデジタル表現が使用されても良く、従って時間離散相互相関:

が使用されても良く、但しMは適切な設計パラメータであり、相関信号が決定される時間間隔を示す。
従って、第1の相関信号は、所与の時間値についてマイクロフォン信号及び第1の相関性信号が、所与の時間値に対応する相対時間オフセットとどの程度同様かを示す信号であり得る。
従って、第1の相関信号は、マイクロフォン信号と両方のスピーカ101、103からレンダリングされる共通音声との間の(相互)相関を反映する。第1の相関信号は、スピーカ101、103からマイクロフォンへの音響伝達関数のインパルス応答と見なされ得る。第1の相関性信号は共通の信号成分、即ちスピーカ101、103の両方からレンダリングされる音声に対応するため、第1の相関信号は、とりわけ第1のスピーカ101及び第2のスピーカ103のそれぞれからの音響伝達関数の和に対応すると見なされ得る。
スピーカからマイクロフォンへの音の伝搬を表す音響伝達関数は、音声がマイクロフォンに到達し得る経路を反映する。特に音響伝達関数は、典型的には直接路成分、早期反射成分、及び反響又は拡散成分によって作られる。直接路成分は、ラウドスピーカからマイクロフォンに一切の反射なしに直接伝搬する音声に対応する。早期反射成分は、多くの場合せいぜい数回の反射によってマイクロフォンに到達する最初の反射音に対応する。反響又は拡散部分は、それぞれの寄与度がもはや区別できないような比較的多数の反射によってマイクロフォンに到達する音声に対応する。
従って、音響伝達関数は、幾何学的設定に関する情報、とりわけスピーカに対するマイクロフォンの位置に依存する情報を含む。実際に、直接成分は直接伝搬に対応し、従って直接成分の伝搬時間はスピーカとマイクロフォンとの間の最短経路に沿う伝搬時間を定める。従って、直接成分の伝搬時間はマイクロフォンとスピーカとの間の距離に対応する。音速は比較的正確に知られているため、伝搬遅延の知識から距離が直接決定され得る。
従って、決定される相関信号はスピーカ101、103からマイクロフォン107までの音の伝搬に関する情報、従ってスピーカ101、103からマイクロフォン107までの距離に関する情報を含む。
しかし、第1の相関性信号は両方のスピーカ101、103からレンダリングされる信号成分を含むため、2つのスピーカ101、103のそれぞれに関する情報が組み合わせられ、それらの2つの情報を区別できない場合がある。例えば、両方のスピーカ101、103までの距離が第1の相関信号から推定されても、それらの距離のどちらが、どちらのスピーカに関するのかが分からない。従って、ラウドスピーカ101、103まで等距離の面を中心に対称的である位置を区別することができない。
図3は、第1の相関器213によって生成される相関性信号とマイクロフォン信号との間の相互相関の一例を示し、マイクロフォン107は図1の位置Aに対応する位置にある。図示の通り、この相互相関は2つの主な活動区間を含む。そのうちの1つは第1のスピーカ101からの音声に対応し、他方は第2のスピーカ103からの音声に対応する。従って、一方の区分は第1のスピーカ101からマイクロフォン107への音響伝達関数のインパルス応答に対応し、他方の区分は第2のスピーカ103からマイクロフォン107への音響伝達関数のインパルス応答に対応する。しかし、どの区分がどのスピーカに対応するのかを、相互相関信号から明らかにすることはできない。各区分はインパルス応答、即ち直接路、早期反射、及び反響の効果の指標を与えることも指摘しておく。検出されるインパルス応答の開始のタイミングから直接路のタイミングが明らかにされ得る。
どのスピーカがどのインパルス応答の元であるのか不確実であることにより、図3の相互相関信号から得られ得る位置情報に固有の曖昧さがある。更に図3の例では、様々なインパルス応答からの寄与度が時間単位で分けられ、区別が容易である。しかし、2つのスピーカ101、103から等距離であることにより近い位置ではインパルス応答が重複し、それぞれの寄与度を分けることは実質的により困難であり、場合により不可能であり得る。更に、音声は典型的には異なる空間チャネルについて(特にステレオ信号又はサラウンドシステムの正面チャネルで)強い相関成分を有するが、必ずしもそうでない場合もある。実際に、音声によっては信号が強く無相関性の場合もあり、低レベルの相関性信号、従って生成される相互相関信号の比較的低い信号対雑音比を引き起こす。
従って、生成される相互相関信号は、スピーカ101、103に対するマイクロフォン107の位置に依存する特性を有し得るが、一部のシナリオでは、マイクロフォン107の位置を決定する際に情報を活用するのが困難な場合がある。
図2の例では、位置推定ユニットが、第2の生成器209に結合される第2の相関器215を更に含む。第2の相関器215は、第2の生成器209から第1の(又は左の)無相関性信号を受け取り、即ち第2の相関器215は、右の入力信号の信号成分と共通ではない左の入力信号の信号成分を含む無相関性信号を受け取る。次いで第2の相関器215は、マイクロフォン信号と左の無相関性信号との間の相互相関として、左の相関信号とも呼ばれる第2の相関信号の生成に進む。第2の相関器215は、マイクロフォン信号との相関に相関性信号ではなく左の無相関性信号を使用することを除き、第1の相関器213と同じ動作を行うことができる。
従って、とりわけ第2の相関器215は信号:

又は時間離散相互相関バージョン:

を生成することができる。
このようにして、第2の相関器215は第2の相互相関信号を生成する。しかし、この相互相関信号は左のスピーカ101だけからレンダリングされる音声に基づき、そのため左のスピーカ101からマイクロフォン107への音響伝達関数しか反映しない。
図2の例では、位置推定ユニットが、第3の生成器211に結合される第3の相関器217を更に含む。第3の相関器217は、第3の生成器211から第2の(又は右の)無相関性信号を受け取り、即ち第3の相関器217は、左の入力信号の信号成分と共通ではない右の入力信号の信号成分を含む無相関性信号を受け取る。次いで第3の相関器217は、マイクロフォン信号と右の無相関信号との間の相互相関として、右の相関信号とも呼ばれる第3の相関信号の生成に進む。第3の相関器217は、マイクロフォン信号との相関に相関性信号又は左の無相関性信号ではなく右の無相関性信号を使用することを除き、第1の相関器213及び第2の相関器215と同じ動作を行うことができる。
従って、とりわけ第3の相関器217は信号:

又は時間離散相互相関バージョンでは:

を生成することができる。
このようにして、第3の相関器217は第3の相互相関信号を生成する。しかし、この相互相関信号は右のスピーカ103だけからレンダリングされる音声に基づき、そのため右のスピーカ103からマイクロフォン107への音響伝達関数しか反映しない。
図4は、マイクロフォン107が図1の位置Aに対応する位置にある例での、第2の相関信号(LAとして記載)及び第3の相関信号(LBとして記載)の例を示す。
図示の通り、各相関信号は有意の振幅を有する1つの領域だけを含む。これは、これらの相関信号のそれぞれが、主に第1のスピーカ101及び第2のスピーカ103の1つだけからレンダリングされる音声に基づくためである。従って、各相関信号は音響伝達関数の1つだけのインパルス応答、即ち第1のスピーカ101からマイクロフォン107への音響伝達関数又は第2のスピーカ103からマイクロフォン107への音響伝達関数に対応する。
しかし、同じく図4に示されているように、無相関性音声は典型的には相関性音声よりも低いパワーレベルを有し、従って対応する相関信号の信号対雑音比は、相関性信号についてよりも低い傾向にある。従って、第2の相関信号及び第3の相関信号だけに基づくマイクロフォン位置の決定は、望まれるよりもしばしば精度が低く、信頼できない傾向がある。
図2の位置推定ユニットでは、第1の相関器213、第2の相関器215、及び第3の相関器217の全てが、3つの相関信号が与えられる位置推定器219に接続される。位置推定器219は、第1の相関信号、第2の相関信号、及び任意選択的に第3の相関信号に応答してマイクロフォン107の位置を推定するように構成される。
従って図2のシステムでは、マイクロフォン107の位置が、相関の1つにだけ基づいて推定されるのではなく、相関性信号に対するマイクロフォン信号の相関、無相関性信号の少なくとも1つに対するマイクロフォン信号の相関、及び多くの場合その両方に基づいて推定される。
相関信号は、異なるスピーカ101、103からの音声が何時マイクロフォン107において受け取られたのかについての情報を含み、従ってマイクロフォンが異なるスピーカ101、103からどの程度離れているのかについての情報を与える。この情報は、位置推定を決定するために様々な実施形態において様々な方法で使用され得る。
例えば位置推定器219は、スピーカ101、103からマイクロフォンまでの音声の到達時間推定値(又は同等に伝搬遅延)を決定することができ、その後それらの推定値から位置を決定しても良い。
具体例として、第1の相関信号に基づき、位置推定器219が第1の到達時間推定値及び第2の到達時間推定値を決定することができる。例えば図2に示されているように、第1の相関信号は、スピーカ101、103からマイクロフォン107への音響伝達関数の複合インパルス応答に対応し得る。第1の直接路のタイミング、即ち各インパルス応答の第1の信号成分が、関連するスピーカ101、103からマイクロフォン107までの距離の直接的測度を与える。
位置推定器219は、第1の相関信号にピーク検出が適用されることに応答して到達時間推定値を決定することができる。このピーク検出は、第1の相関信号内の2つの極大を検出することができる。多くの場合、直接路は最も強い信号成分を与えると考えることができ、従って極大は直接路に対応すると見なされ得る。従って、ピーク検出は、所与の時間間隔内で相関が最も高い時間オフセットτを検出することができる。この時間オフセットは、スピーカ101、103からマイクロフォンへの伝搬遅延の測度を直接与える。従って音速を使用し、距離がしかるべく計算され得る。スピーカ101、103までの距離が分かっている場合、マイクロフォン107の位置が決定され得る。実際にその位置は、スピーカ101、103までの距離として直接与えられ得る。到達時間推定値、伝搬遅延、又は飛行時間の決定は等価と見なされ得ることが理解されよう。
第1の相関信号だけに基づいて2つの距離が決定され得るが、どちらの距離が第1のスピーカ101に関係し、どちらが第2のスピーカ103に関係するのかを明らかにすることはできない。従って、第1の相関信号に基づく検討は、それらの距離によって与えられる位置の1つとしてマイクロフォン107を決定することしかできず、とりわけスピーカ101、103の中心線/面を中心に対称的である2つの位置を区別することは、それらが(異なるスピーカに対してであるが)同じ2つのスピーカ距離を有するためにできない。
但し、第2の相関信号及び第3の相関信号の1つ(又は両方)を検討することにより、この曖昧さが解決され得る。例えば、第1の相関信号内の検出ピークの両方の時点を含む所与の時間間隔内の最大値を検出するために、ピーク検出が第2の(左の)相関信号に対して行われても良い。次いで、ピークのタイミングが第1の相関信号内のピークの時点と比較される。その後、位置推定器219は、第2の相関信号内のピークのタイミングに基づき、第1の相関信号のピーク検出を左のスピーカ101及び右のスピーカ103のそれぞれに割り当てることができる。とりわけ、第2の相関信号のピークに最も近い第1の相関信号のピークが第1の(左の)スピーカ101に割り当てられ、他方のピークが第2の(右の)スピーカに割り当てられ得る。
一部の実施形態では、スピーカ101、103のそれぞれに対する第1の相関信号のピークの割り当ては、第2の相関信号及び第3の相関信号の両方に基づき得る。例えば、第2の相関信号及び第3の相関信号のピークのそれぞれに対する、第1の相関信号のピークのそれぞれのタイミングについて距離測度が決定され得る。次いで、第2の相関信号及び第3の相関信号の対応するピークに対する第1の相関信号のピークの割当て毎に複合距離推定値が決定されても良く、最も低い全体的な距離測度をもたらす割当てが選択され得る。
到達時間/伝搬遅延/飛行時間の推定は、ピーク検出に基づかなくても良いことも理解されよう。例えば一部の実施形態では、例えば所与の(信号に依存し得る)閾値を上回る第1の信号成分についてタイミングが決定されても良い。かかる手法は、例えば直接路成分が最も強い信号成分でなくても(例えば直接路に沿う音響減衰によって反射の方が強くても)、直接路成分が検出されることを可能にし得る。
従って一部の実施形態では、位置推定が、第1のスピーカ101及び第2のスピーカ103からの2つの音声の到達時間差、又はスピーカ101、103からマイクロフォン107に伝搬する音声の絶対飛行時間に基づき得る。後者の選択肢は、システムが時間的に同期されている場合に特に使用され得る。簡単にするために、以下の説明は再生及び捕捉の相対時間が分かっている同期された事例に焦点を当てる。
この具体的手法は、スピーカ101、103からの再生信号と捕捉信号、即ちマイクロフォン信号との間の相互相関関数を決定することによって飛行時間を推定する。次いでこの手法は、相互相関関数の最大値に対応する時間位置を求める。
2つの信号間の時間差を推定するための様々なアルゴリズムが使用され得る。例えば、信号の時間領域表現又は周波数領域表現に基づく様々な種類の正規化され若しくは一般化された相互相関係数を計算することに基づく技法が知られている。別の例として、正規化された最小二乗平均フィルタ又は周波数領域適応フィルタ等の適応フィルタリング技法の公式化が知られており、信号間の時間差の指標を与えることができる。
以下、任意の2つの信号s(n)とs(n)との間の時間差を表すために、汎用演算子(generic operator)TD[s(n),s(n)]が使用され得る。捕捉されるマイクロフォン信号はm(n)で示される。図2の位置Aにおけるマイクロフォン107を検討し、
LA=TD[u(n),y(n)]p
RA=TD[u(n),y(n)]p
が成立するように、左右の無相関性信号を使用することによって経路長LA及びRAが得られても良く、p=c/fであり、cは空中の音速であり、fはシステム内のデジタル音声データのサンプリング周波数である。
この例では、ラウドスピーカ101、103からマイクロフォン107への音響インパルス応答が、図4のインパルス応答に対応する特定の相互相関によって生成される。受け取られるマイクロフォン信号が両方のラウドスピーカからの信号を含むため、応答は比較的高度の雑音を含み、即ち第1のスピーカ101からレンダリングされる音声が第2のスピーカ103の相互相関に雑音を生じさせ、その逆の場合も同様である。しかし、直接路LA及びRAに対応するピークが応答内で明確に識別され得る。TD演算は、とりわけインパルス応答内の最大ピークの位置に対応する時間遅延をもたらすことができる。
ラウドスピーカL及びRの正面の平面内のマイクロフォンの位置Aは、2つのラウドスピーカ101、103間の距離の知識(分かっているか、音響測定又は他の測定を使用して推定されると仮定する)と共に、2つの距離測度LA及びRAから三角法を使用して直接決定され得る。
2つの無相関性信号だけを使用する手法は、2つのスピーカ101、103からレンダリングされる音声がほぼ無相関性化されている一部の音声信号について妥当な結果をもたらすことができる。しかし、共通の及び相関性のある音声が増加するにつれ、決定されるインパルス応答の雑音が所与の信号エネルギに関してますます多くなる。従って本システムは、第1の相関信号、即ち2つのスピーカ101、103の相関性信号成分との相関を検討することによって与えられる情報を使用することができる。この信号はインパルス応答の組合せに対応するが、(図3に示されているように)はるかに雑音が少ない信号をもたらすことができ、従ってタイミング、それ故に到達時間(又は同等に飛行時間)の推定値を実質的により正確に決定できるようにし得る。従って位置推定器219は、続けて第1の相関信号から2つの到達時間推定値を決定することもできる。
次いで、異なる到達時間推定値が組み合わせられ得る。例えば、第1の相関信号の到達時間推定値と、第2の相関信号及び第3の相関信号の到達時間推定値との間のペアリング、例えば互いに最も近い時間推定値を単純にペアにすることが行われても良い。時間推定値のペア毎に、例えばペアの時間推定値を(場合により加重)平均することによって複合時間推定値が計算され得る。その結果生じる2つの時間推定値は、スピーカ101、103のそれぞれからマイクロフォン107までの飛行時間推定値、従って距離に対応し、よってマイクロフォン107の位置が決定され得る。
或る相関信号の直接路成分の検出(とりわけピーク検出)は、他の相関信号のうちの1つの特性に基づき得る。とりわけ、第1の相関信号内のピーク検出は、第2の相関信号又は第3の相関信号に依存し得る。
例えば、まず第2の相関信号に対してピーク検出が行われ、ピーク/直接路の推定時点をもたらすことができる。理想的なシナリオでは、第1のスピーカ101の直接路のタイミングが、第1の相関信号の同じ時点において生じるものとする。しかし雑音により、幾らかのずれがあり得る。但し、第2の相関信号から決定される時間推定値が、第1の相関信号のピーク検出のガイドとして使用され得る。例えば、第1の相関信号のピーク検出は、第2の相関信号内のピークのタイミングを中心とした所与の時間窓の中で行われ得る。
他の実施形態では、より複雑な手法が例えば使用されても良く、実際に例えばマイクロフォン107が異なる位置にある確率を表す確率分布又はマップ等のより複雑な推定として位置推定が生成され得る。
とりわけ一部の実施形態では、第1の相関信号及び第2の相関信号並びに典型的には第3の相関信号に基づき、マイクロフォン107の位置が所与の領域内にある確率を決定するように位置推定器219が構成され得る。
この確率は、その領域に対応する時間間隔内の相関信号を検討することによって決定され得る。例えば、直接路を仮定し、第1のスピーカ101からその領域までの1つ又は複数の伝搬遅延が計算されても良い。例えば、第1のスピーカ101からの最短距離及び最長距離が決定されても良く、対応する最小伝搬遅延及び最大伝搬遅延が決定され得る。従って、あり得る伝搬遅延に対応する第1の相関信号及び第2の相関信号の間隔(即ち間隔は最小伝搬遅延から最大伝搬遅延とすることができ、計算され得る)が決定され得る。
次いで、第1の相関信号の特性がこの間隔内で検討され得る。例えば、特性はピークのタイミングとすることができ、ピークの検出位置が間隔内に含まれるかどうかに応じて確率が決定され得る。別の例として、検討される特性は、間隔内の第1の相関信号の最大信号レベルでも良い。マイクロフォン107が所与の間隔内にある場合、間隔内の最大信号レベルが時間間隔の外側よりも高い可能性が高く、即ち他の領域よりもこの領域の方が高い可能性がある。別の例として、間隔内の累積信号レベル又は平均信号レベルが決定されても良い(又は同等に時間間隔内の信号エネルギが決定されても良い)。信号レベルは、マイクロフォン107が領域内に位置しない場合よりも位置する場合に高い可能性がある。
第2の相関信号及び第3の相関信号についても同じ特性が評価され得る。
第1のスピーカ101及び第2のスピーカ103の両方について、領域の時間間隔が決定され得る。第1の相関信号では、信号が両方の時間間隔内で評価され、第2の相関信号では、信号が第1のスピーカ101の時間間隔内で評価され、第3の相関信号では、信号が第2のスピーカ103の時間間隔内で評価される。
その結果生じる値が結合されても良い。複雑度が低い例として、計算された到達時間推定値のうちのどれ位が決定された時間間隔内にあるのかを単純に反映するために、領域の確率指標(即ちその領域内にマイクロフォン107がある可能性を示す値)が決定され得る。従って、計算された全ての到達時間推定値がその領域に関連する時間間隔内にある場合、その領域内にマイクロフォン107がある確率が高い。
より高度な実施形態では、位置推定器219が、例えば時間間隔及び信号のそれぞれの値を組み合わせても良い。例えば、2つの時間間隔内の第1の相関信号の最大信号レベル、並びに適切な時間間隔内の第1の相関信号及び第2の相関信号の最大信号レベルが加算され、マイクロフォン107の位置が領域内にある確率を示す値が生成されても良い。例えば他の領域について決定された信号エネルギ及び/又は値に対する正規化が多くの実施形態において実行され得ることが理解されよう。
この手法は他の領域についても繰り返され得る。とりわけ、区域(又は体積)が複数の領域に分割されても良く、各領域に対してこの手法が実行され、それによりマイクロフォン107の位置が個々の領域内にある確率のマップを構築することができる。位置の推定はこのマップ形式で行われても良く、又は例えば最も高い確率を与える領域の中心点を選択することにより、更なる処理を実行してマイクロフォン107の単一の位置推定を決定することができる。
具体例として、図5は、2つのラウドスピーカ101、103の正面区域のマップの一例を示す。ラウドスピーカ101、103の正面区域はグリッドに分割される。この具体例では、分割が平面内の位置である40×40のセルグリッドに行われる。例えば、各セルは実世界では20cm×20cmとすることができる。
各(x,y)セルは、マイクロフォン107がセル/領域内にある可能性を表す尤度L(x,y)に関連する。様々な相関信号から決定される指標が累積され、L(x,y)セル尤度変数を修正するために使用される。例えば次式
L(x,y)=gL(x,y)+(1−g)(I+I+I+I
が成立し、但し、Iは、セル/領域(x,y)に関する第1の時間間隔内の第1の相関信号の最大信号値であり、Iは、第2の時間間隔内の第1の相関信号の最大信号値であり、Iは、第1の時間間隔内の第2の相関信号の最大信号値であり、Iは、第2の時間間隔内の第3の相関信号の最大信号値であり、gは設計パラメータ(例えばg=0.9)であり、Iの値のそれぞれが間隔[0;0.25]に正規化される。
図5は、しばらくの間ステレオ音声を再生した後のあり得る結果を示す(より暗い色がより高い確率を示す)。マイクロフォンの位置であることを示唆する位置(13,14)(暗い色)において、及びその周囲で最大尤度が見つかる。位置(31,14)においても幾らか上昇した尤度があり、これは第1の相関信号の曖昧さによる。しかし、第2の相関信号及び第3の相関信号の情報との組合せが、位置(13,14)についてである最も高い(最も暗い)確率を明確にもたらす。最高尤度L(x,y)を有するセルを探すことにより、マイクロフォン107の位置が単純に決定され得る。
上記のマップに基づく方法は、環境に関する追加情報も利用することができる。一部の実施形態では、位置推定を制御するために、壁及び場合により家具の位置を含む間取り図を使用できることもあり得る。過去見つかった位置により強い重みを与えるために、システムの使用履歴を使用することも可能である。
先に述べたように、相関性信号及び無相関性信号を生成するための様々な手法が様々な実施形態で使用され得る。以下、或る具体例について説明される。
この例では、分解器205が、入力ステレオチャネルの相関の評価に基づいて相関性信号及び無相関性信号を生成するように構成される。具体的には、相関性信号と無相関性信号とを合成するために、入力ステレオチャネル間の相関を示す相関測度が分解器205によって使用される。かかる分解器205の要素の一例が図6に示されている。以下の例は、相関性信号及び無相関性信号が第1の(左の)入力信号からどのように生成されるのかを説明する。
図6の分解器205は、入力ステレオ信号を受け取る受信器601を含む。分解器205は、入力ステレオ信号の相関測度を生成するように構成される相関推定器603を更に含む。受信器601及び相関推定器603はアップミキサ605に結合され、アップミキサ605は受信器601から第1の(左の)入力信号が与えられ、続けてその信号をアップミックスして2つの対応する信号、つまり相関性信号及び無相関性信号を生成する。
図6の例では、直接相関を行うことによって相関測度を生成するように相関推定器603が構成される。相関測度は、時間周波数タイルとも呼ばれる複数の時間周波数間隔のそれぞれについて特定の相関値を含むことができる。実際に、第1の入力信号のアップミックスが時間周波数タイル内で実行されても良く、相関測度は時間周波数タイル毎に相関値を与えることができる。
一部の実施形態では、相関測度の分解能が、アップミックスの時間周波数タイルの分解能よりも低い場合がある。例えば、幾つかのERB帯域のそれぞれについて等、幾つかの知覚有意帯域(perceptual significance band)のそれぞれについて相関値が与えられ得る。各知覚有意帯域は、複数の時間周波数タイルを対象として含むことができる。
相関測度がアップミキサ605に与えられても良く、アップミキサ605は続けて相関性信号及び無相関性信号それぞれの利得を決定することができる。とりわけ入力信号が区分化され、周波数領域に変換されても良い。アップミキサ605は、対応する時間周波数タイルの相関値から導出される利得を周波数領域値と乗算することにより、時間区分内の周波数領域値(FFTビン値)毎に(即ち時間周波数タイル毎に)相関信号値を生成することができる。利得は相関が増すにつれて増加し得る。その結果、入力信号の相関成分の強い重み付けを含む周波数領域信号が生成される。
同様に、アップミキサ605は、対応する時間周波数タイルの相関値から導出される利得を周波数領域値と乗算することにより、時間区分内の周波数領域値(FFTビン値)毎に(即ち時間周波数タイル毎に)無相関性信号値を生成することができる。利得は相関が増すにつれて減少し得る。その結果、入力信号の相関性成分の弱い重み付け、従って無相関性信号成分の強い重み付けを含む周波数領域信号が生成される。
次いで、生成された2つの周波数信号が変換されて時間領域に戻され、相関性信号及び無相関性信号を与えることができ、又は周波数領域内で更に処理するために周波数領域内に与えられ得る。
アップミキサ605は、とりわけ信号の全体的なエネルギレベルを正確に又はおおよそ維持するために利得を決定することができる(特に利得の和又は二乗和が1に設定され得る)。アップミキサ605は、利得の周波数領域の平滑化を行うように更に構成されても良く、この平滑化は知覚音質を改善することができる。
より詳細には、第1の入力信号が、短時間入力信号ベクトル
x(n)=[x(n),x(n−1),...,x(n−K+1)]
又は離散フーリエ変換を使用して得られるスペクトルベクトル
X(n,ω)=Fwx(n)
によって与えられても良く、Fはフーリエ基底関数の行列であり、窓関数wは、例えば対角線上のハニング窓関数係数及び他所で0の対角行列である。
この具体例では、左右両方の入力信号がアップミックスされ、従ってアップミックスがステレオ信号
X(n,ω)=[X(n,ω),X(n,ω)]
に適用される。かかるステレオベクトル信号のMチャネルベクトル信号へのアップミックス

が変換成分毎に別々に行われ得る。ω番目の周波数成分では、アップミックスされたベクトル信号が
Y(n,ω)=G(n,ω)X(n,ω)
によって与えられ、但しG(n,ω)は行列演算である。この具体例ではフィルタ行列を以下の形で書くことができる。

この行列は左右のチャネルを混合しない(行列内の0)。
行列の利得は相関測度から決定される。
更に、相関性信号の重み(即ちg11及びg31)は、相関測度(とりわけその時間周波数タイル内の相関値)の単調増加関数として決定される。従って、特定の時間周波数タイルの信号エネルギの相関性信号への割り当ては、2つの空間チャネルが相関しているほど増加する。利得は他のパラメータ及び事項にも依存することがあるが、相関値との関係は単調増加となることが理解されよう。
無相関性信号の重み(即ちg22及びg42)は、相関測度(とりわけその時間周波数タイル内の相関値)の単調減少関数として決定される。従って、特定の時間周波数タイルの信号エネルギの背景信号への割り当ては、2つの空間チャネルの相関が少ないほど、即ちより拡散音に対応するほど増加する。利得は他のパラメータ及び事項にも依存することがあるが、相関値との関係は単調減少となることが理解されよう。
従って分解器205は、入力ステレオ信号を、相関性のある信号成分及び相関性の無い信号成分へと分解する。
相関推定器603は、この具体例では2つの入力ステレオ信号の間である相関値を決定する。2入力データシーケンスでは、相関係数が

として定義されても良く、但し<...>は、変数n上での2つのデータセットの内積の期待値の計算を表わす。相関係数Cの値が1に近づく時、2つのチャネル内でコンテンツがコヒーレントであると言うことができる。
2つの入力チャネルの信号パワー及び積は、各周波数ビン内で以下のように得ることができ:
Φij(n,ω)=X(n,ω)X(n,ω) (i,j=1,2)
但しは複素共役を表す。これらの瞬間量を所与とし、例えば適応パラメータλ1と共に一次積分器を使用して時間方向フィルタリングが適用され、
φij(n,ω)=λφij(n,ω)+(1−λ)φij(n−1,ω)
によって与えられるスライディング窓推定値がもたらされても良い。次いで、時間周波数タイルごとの相関値が

として決定され得る。
生成された相関測度に平均化が適用されても良い。例えば、周波数方向の平均化プロセスは多くのシナリオにおいて音質を大幅に改善し得る。
実際に、図6のシステムでは、複数の時間周波数間隔の相関値の(重み付けされた)周波数の平均化に応じて、所与の時間周波数間隔の相関値を決定するように相関推定器603が構成される。こうしてスペクトルの平滑化が実行され得る。
従って、

として相関値が決定されても良く、但しS[.]は適切な周波数平滑化関数を示す。例えば、三角形又は四角形の平滑化関数が適用され得る。複雑度が低い例として、平滑化関数Sは、現在の時間周波数タイルの平滑化されていない相関値及び(周波数領域内の)Nの周囲の平滑化されていない相関値の平均を単純に決定しても良い。
個々の利得係数
kp(n,ω),k=1,2,p=1,...,4
が例えば下記のように決定され得る。

一部の実施形態では、利得を決定する際に他のパラメータ又は特性が考慮されても良い。特に図6のシステムでは、相関推定器603が、チャネルのエネルギ差推定値に応じて任意選択的に利得を決定することができる。
この具体例では、入力ステレオ信号のそれぞれについて相関性信号及び無相関性信号が生成される。従って一部の実施形態では、入力ステレオ信号x(n),x(n)が1対の新たなステレオ信号c(n),c(n)及びu(n),u(n)に分解され得る。そのような例では、相互相関関数が十分長い間隔にわたって以下を満たす。
cc=E[c(n),c(n)]→C≠0
uu=E[u(n),u(n)]→0
特定の分解手法の更なる詳細をPCT/IB2013/050331号の中で見つけることができる。
一部の実施形態では、位置を決定する際、位置推定器219が第2の相関信号及び第3の相関信号に対して第1の相関信号に重み付けすることができる。従って、相関性信号成分及び無相関性信号成分のそれぞれに由来する位置決定への有意性及び影響が動的に調節され得る。
一部の実施形態では、重み付けが単純な選択重み付けであり得る。例えば、レンダリングされる音声が高濃度の相関性信号成分及び低濃度の無相関性信号成分を有する場合、位置推定器219は単純に第1の相関信号に基づいて位置を決定することに決めることができる。例えばこの場合、到達時間推定値が第1の相関信号内のピークに対応するものとして決定され得る。これらのタイミングは直接使用されても良く、第2の相関信号又は第3の相関信号に基づいて修正されなくても良い。但し、2つの推定値をそれぞれのスピーカに割り当てるために、第2の相関信号及び/又は第3の相関信号からの結果が使用されても良い。
逆に、レンダリングされる音声が無相関性信号成分を主に含む場合、位置推定器219は代わりに第2の相関信号及び第3の相関信号の特性に基づいて位置を決定することができる。例えば、第2の相関信号及び第3の相関信号から決定される到達時間推定値が直接使用されても良く、第1の相関信号から決定される到達時間推定値が無視されても良い。
多くの実施形態では、より段階的な重み付けが適用される。例えば、或る領域に対応する様々な時間間隔内の相関信号の最大信号値に基づいてその領域の位置確率指標が求められる場合、求められた信号値は、重みが動的に調節される加重総和によって組み合わせられても良い。例えば、高密度の相関性音声がある場合、第1の相関信号の最大値が強く重み付けされるのに対し、高密度の無相関性音声がある場合、第2の相関信号及び第3の相関信号の最大値が強く重み付けされる。
別の例として、一部の実施形態では、第1のスピーカ101からマイクロフォン107までの到達時間推定値が、第1の相関信号のピーク検出及び第2の相関信号のピーク検出の両方から求められる。その結果生じる2つの到達時間推定値は、各到達時間推定値の重みが適応され得る加重総和によって平均されても良い。
多くの実施形態では、重み付けの適応が、第2の相関信号のパワーレベルに対する第1の相関信号のパワーレベルに基づいて決定され得る。実際に、レンダリングされる音声の殆どが相関される場合、第1の相関信号のパワーレベルは第2の相関信号のパワーレベルよりも高いのに対し、レンダリングされる音声の殆どが相関性がない場合、第2の相関信号又は第3の相関信号のパワーレベルが第1の相関信号のパワーレベルよりも高くなる。
或いは、又は加えて、重み付けの適応は、無相関性信号のパワーレベルに対する相関性信号のパワーレベルに基づいても良い。従って、重み付けは、入力信号から分解器205によって生成される信号の相対的パワーレベルに直接依存し得る。これらの信号は、相関性音声及び無相関性音声のそれぞれとしてレンダリングされる音声の推定値を直接もたらす。更にこれらの信号は音響又は測定雑音に依存せず、そのことは、状況によっては重み付けを改善することを可能にし得る。
他の実施形態では、重み付けを適応するために他の特性が使用され得ることが理解されよう。例えば、位置を決定する際に様々な相関信号の相対的な重み付けを適応するために、相関信号の信号対雑音比が求められ、使用されても良い。
上記の説明では、明瞭にするために、本発明の実施形態が様々な機能回路、ユニット、及びプロセッサに関して説明されたことが理解されよう。しかし、様々な機能回路、ユニット、又はプロセッサ間での任意の適切な機能分散が、本発明を損ねることなしに使用され得ることが明らかである。例えば、別々のプロセッサ又はコントローラによって実行されるように示されている機能が、同じプロセッサ又はコントローラによって実行されても良い。従って、特定の機能ユニット又は回路への言及は、厳密な論理的又は物理的構造若しくは構成を示すのではなく、記載された機能を提供するための適切な手段の言及に過ぎないと見なされるべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せを含む任意の適切な形式で実装され得る。本発明は、任意選択的に、1個又は複数個のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして少なくとも部分的に実装されても良い。本発明の実施形態の要素及び構成要素は、任意の適切な方法で物理的に、機能的に、及び論理的に実装され得る。実際に、機能は単一のユニットによって、複数のユニットによって、又は他の機能ユニットの一部として実装され得る。そのため、本発明は単一のユニットによって実装されても良く、又は様々なユニット、回路、及びプロセッサ間で物理的に及び機能的に分散されても良い。
本発明が一部の実施形態に関連して説明されてきたが、本発明を本明細書に記載した特定の形態に限定ことは意図されない。むしろ本発明の範囲は、添付の特許請求の範囲によってのみ限定される。更に、或る特徴が特定の実施形態に関連して説明されているように思われ得るが、説明した実施形態の様々な特徴が本発明に従って組み合わせられても良いことを当業者は理解されよう。特許請求の範囲では、含むという用語は他の要素又はステップがあることを除外するものではない。
更に、別々に記載したが、複数の手段、要素、回路、又は方法のステップが、例えば単一の回路、ユニット、又はプロセッサによって実施されても良い。加えて、個々の特徴が異なる請求項の中に含まれる場合があるが、それらの特徴は場合により有利に組み合わせられても良く、異なる請求項の中に含まれることは、特徴の組合せが実現可能でないこと及び/又は有利でないことを意味するものではない。更に、或る請求項のカテゴリに特徴を含めることは、そのカテゴリに限定することを含意せず、むしろその特徴が必要に応じて他の請求項のカテゴリに等しく適用され得ることを示す。更に、特許請求の範囲の中の特徴の順序は、それらの特徴が実行されなければならない如何なる特定の順序も含意せず、とりわけ方法クレーム内の個々のステップの順序はステップがその順序で実行されなければならないことを含意するものではない。むしろ、ステップは任意の適切な順序で実行され得る。加えて、単数形での言及は複数形を除外しない。従って、「1つの(a)」、「1つの(an)」、「第1の」、「第2の」等の言及は複数形を排除しない。特許請求の範囲の中の参照符号は明確にするための例として与えるに過ぎず、特許請求の範囲を如何なる方法でも限定するものとして解釈されるべきでない。



  1. マイクロフォンの位置を決定するための機器であって、当該機器は、
    第1の位置にある第1のスピーカによるレンダリングのための第1のチャネル及び第2の位置にある第2のスピーカによるレンダリングのための第2のチャネルを少なくとも含む、マルチチャネル信号を受け取るためのマルチチャネル信号受信器と、
    前記マルチチャネル信号から第1の相関性信号を生成するための第1の信号生成器であって、前記第1の相関性信号は前記第1のチャネル及び前記第2のチャネルの相関性信号成分を含む、第1の信号生成器と、
    前記マルチチャネル信号から第1の無相関性信号を生成するための第2の信号生成器であって、前記第1の無相関性信号は前記第2のチャネルの信号成分と相関性の無い前記第1のチャネルの信号成分を含む、第2の信号生成器と、
    前記マイクロフォンからマイクロフォン信号を受け取るためのマイクロフォン信号受信器と、
    前記マイクロフォン信号と前記第1の相関性信号との相関から第1の相関信号を決定するための第1の相関器と、前記マイクロフォン信号と前記第1の無相関性信号との相関から第2の相関信号を決定するための第2の相関器と、前記第1の相関信号及び前記第2の相関信号に応じて前記マイクロフォンの位置を推定するための位置推定器とを含む、
    機器。

  2. 前記マルチチャネル信号から第2の無相関性信号を生成するための第3の信号生成器であって、前記第2の無相関性信号は前記第1のチャネルの信号成分と相関性の無い前記第2のチャネルの信号成分を含む、第3の信号生成器と、
    前記マイクロフォン信号と前記第2の無相関性信号との相関から第3の相関信号を決定するための第3の相関器とを更に含み、
    前記位置推定器は、前記第3の相関信号に更に応じて前記マイクロフォンの位置を推定する、請求項1に記載の機器。

  3. 前記位置推定器は、前記第1の相関信号に応じて前記第1のスピーカ及び前記第2のスピーカから前記マイクロフォンへの音声の第1の到達時間推定値及び第2の到達時間推定値を生成するための第1の推定器と、
    第1の無相関性信号に応じて前記第1のスピーカから前記マイクロフォンへの音声の第3の到達時間推定値を生成するための第2の推定器とを含み、
    前記位置推定器は、前記第1の到達時間推定値、前記第2の到達時間推定値、及び前記第3の到達時間推定値に応じて前記マイクロフォンの位置を推定する、請求項1に記載の機器。

  4. 前記位置推定器は、前記第3の到達時間推定値に応じて前記第1のスピーカ及び前記第2のスピーカの一方に前記第1の到達時間推定値を割り当てる、請求項3に記載の機器。

  5. 前記位置推定器は、前記第3の到達時間推定値、並びに前記第1の到達時間推定値及び前記第2の到達時間推定値のうちの1つから前記第1のスピーカの音声の複合到達時間推定値を決定し、前記複合到達時間推定値に対応する前記第1のスピーカからの距離を有するように前記マイクロフォンの位置を決定する、請求項2に記載の機器。

  6. 前記複合到達時間推定値を生成する際の前記第3の到達時間推定値、並びに前記第1の到達時間推定値及び前記第2の到達時間推定値のうちの1つの相対的な重み付けが、第1の相関及び第2の相関の少なくとも一方に関する相関レベル推定値及び相関雑音推定値の少なくとも1つに依存する、請求項5に記載の機器。

  7. 前記第1の推定器は、前記第1の相関信号内の第1のピーク及び第2のピークを検出し、前記第1のピークのタイミングに応じて前記第1の到達時間推定値を決定し、前記第2のピークのタイミングに応じて前記第2の到達時間推定値を決定する、請求項3に記載の機器。

  8. 前記第1の推定器は、前記第1の相関信号内のピークを検出するためにピーク検出を実行し、前記ピークのタイミングに応じて前記第1の到達時間推定値を決定し、前記ピーク検出は前記第2の相関信号に依存する、請求項3に記載の機器。

  9. 前記位置推定器は、前記第2の相関信号のパワー測度に対する前記第1の相関信号のパワー測度、及び前記第1の無相関性信号の測度レベルに対する前記第1の相関性信号のパワー測度のうちの少なくとも1つに応じて、前記第2の相関信号に対して前記第1の相関信号に重み付けする、請求項1に記載の機器。

  10. 前記位置推定器は、第1の時間間隔内の前記第1の相関信号の特性及び第2の時間間隔内の前記第2の相関信号の特性の少なくとも1つに応じて或る領域内に前記マイクロフォンの位置がある確率を決定し、前記第1の時間間隔及び前記第2の時間間隔は、前記第1のスピーカから前記領域までの音声に関する音声伝搬遅延に対応する、請求項1に記載の機器。

  11. 前記特性が信号レベル測度である、請求項10に記載の機器。

  12. 前記第1のチャネルの第1のチャネル信号を複数の時間周波数間隔に分ける分割器と、
    前記複数の時間周波数間隔の時間周波数間隔毎に、前記第1のチャネルの前記第1のチャネル信号及び前記第2のチャネルの第2のチャネル信号の相関測度を生成するための相関推定器とを更に含み、
    前記第1の信号生成器は、時間周波数間隔毎に、その時間周波数間隔の前記第1のチャネル信号の信号値を、時間周波数間隔に関する相関測度の単調増加関数である重みによって重み付けすることにより、前記第1の相関性信号を生成する、請求項1に記載の機器。

  13. 前記第2の信号生成器は、時間周波数間隔毎に、その時間周波数間隔の前記第1のチャネル信号の信号値を、時間周波数間隔に関する相関測度の単調減少関数である重みによって重み付けすることにより、前記第1の無相関性信号を生成する、請求項12に記載の機器。

  14. マイクロフォンの位置を決定する方法であって、当該方法は、
    第1の位置にある第1のスピーカによるレンダリングのための第1のチャネル及び第2の位置にある第2のスピーカによるレンダリングのための第2のチャネルを少なくとも含む、マルチチャネル信号を受け取るステップと、
    前記マルチチャネル信号から第1の相関性信号を生成するステップであって、前記第1の相関性信号は前記第1のチャネル及び前記第2のチャネルの相関性信号成分を含む、ステップと、
    前記マルチチャネル信号から第1の無相関性信号を生成するステップであって、前記第1の無相関性信号は前記第2のチャネルの信号成分と相関性の無い前記第1のチャネルの信号成分を含む、ステップと、
    前記マイクロフォンからマイクロフォン信号を受け取るステップと、
    前記マイクロフォン信号と第1の相関性信号との相関から第1の相関信号を決定するステップと、
    前記マイクロフォン信号と前記第1の無相関性信号との相関から第2の相関信号を決定するステップと、
    前記第1の相関信号及び前記第2の相関信号に応じて前記マイクロフォンの位置を推定するステップとを含む、方法。

  15. コンピュータ上でコンピュータプログラムが動作するとき、請求項14に記載の方法の全てのステップを実施するためのコンピュータプログラムコード手段を有する、コンピュータプログラム。

 

 

Patent trol of patentswamp
類似の特許
1次アンビソニックス信号、いわゆるBフォーマット信号を供給するマイクロホンからの記録は、音響指向性の限られた認知を示す。音源は、特に、中心を外れた聴取位置について、それらが実際にあるよりも広く認知される。音源は、しばしば、最も近いスピーカ位置から聞こえてきているように位置付けられる。1次アンビソニックス信号の指向性を高める方法及び装置において、付加的な指向性情報(22,23)は低次アンビソニックス入力信号(10)から取り出される(SFA)。付加的な指向性情報は、より高次のアンビソニックス信号(25a)を推定するために使用される。推定された信号は、次いで、入力信号の係数と結合される(CS)。このように、アンビソニックス信号の指向性は高められ、アンビソニックス信号がラウドスピーカ信号へと復号される場合に、空間的な音源の位置決めの精度を向上させる。結果として得られる出力信号は、入力信号よりも多いエネルギを有する。
リスニング領域のインパルス応答を測定するラウドスピーカについて記載する。ラウドスピーカは、オーディオ信号のセグメントに対応する音声を出力できる。音声は、リスナに近接したリスニング装置によって感知され、ラウドスピーカに送信される。ラウドスピーカは、信号セグメントに基づいて、リスニング領域のインパルス応答を推定する適応フィルタを含む。誤差ユニットは、リスニング装置から受信し感知されたオーディオ信号と共に、推定されたインパルス応答を分析して推定値の精度を決定する。精度レベルがその信号セグメントに関して達成されるまで、適応フィルタにより新しい推定値を生成できる。プロセッサは、様々な信号セグメントに対応する1つ以上の推定されたインパルス応答を利用できる。これらの信号セグメントは、リスニング領域のインパルス応答を補償するようにオーディオ信号を調節するための、設定された周波数スペクトルを網羅する。
【選択図】図2
スピーカアレイを用いてクロストークキャンセルを実行するオーディオ受信機が記載されている。オーディオ受信機は、部屋におけるリスナの位置を検出し、1つ以上のビームパターン行列を用いて、スピーカアレイを通して出力される1本の音声プログラムコンテンツを処理する。ビームパターン行列は、1つ以上の制約条件によって、生成する。制約条件として、リスナの右の耳において、右のチャネルを増大させ、かつ、左のチャネルを減少させること、リスナの左耳において、左のチャネルを増大させ、かつ、右のチャネルを減少させること、及び、部屋の全ての他の領域における音声を減少させること、を挙げることができる。これらの制約条件によって、オーディオ受信機は、部屋の周波数応答に対する変動の影響を最小にしてクロストークキャンセルが達成されるように、部屋の他の領域ではなく、主にリスナの方へ音を放射する。他の実施形態もまた記載されている。
リスニング領域における音色の一定性を維持するために、複数の指向性及び周波数にまたがってラウドスピーカアレイを駆動するためのシステム及び方法。一実施形態においては、リスニング領域について説明する周波数独立部屋定数が、第1のビームパターンの指向性指数、リスニング領域内のリスナの位置における直接音/残響音比DR、及びリスニング領域における指定周波数での推定残響時間T60を用いて決定される。この部屋定数に基づき、第2のビームパターン用のオフセットが生成され得る。このオフセットは、一定の音色を実現するための第1のビームパターンと第2のビームパターンとの間でのデシベル差を示しており、複数の周波数における第2のビームパターンを調節する目的で使用され得る。一定の音色を維持することにより、リスニング領域の特性及びサウンドプログラムコンテンツを表現する目的で使用されたビームパターンに関係なく、オーディオ品質が向上する。他の実施形態もまた説明される。
オーディオ受信機と1つ以上のラウドスピーカアレイとを備えるホームオーディオシステムについて説明している。オーディオ受信機は、ラウドスピーカアレイが置かれている部屋の音響特性とラウドスピーカアレイを通じて再生されるサウンドプログラムコンテンツのオーディオ特性とを測定する。オーディオ受信機は、これらの測定値に基づいて、指向性比を割り当て、種々のビームパターンをサウンドプログラムコンテンツの1つ以上のセグメントに潜在的に割り当てる。割り当てられた指向性比は、ラウドスピーカアレイを通じてサウンドプログラムコンテンツのセグメントを再生するために、受信機によって使用される。他の実施形態もまた説明される。
マイクロフィブリル化セルロースの紙破裂強度強化属性を変更する方法、前記マイクロフィブリル化セルロースを含む水性懸濁液、および前記マイクロフィブリル化セルロースを含む製紙用組成物および紙製品。
【選択図】なし
スピーカアレイに対する聴取者の検出されたロケーションに基づき、一定の直接対反響比を維持する指向性調整機器が説明される。指向性調整機器は、距離推定器、指向性補償器及びアレイプロセッサを含んでもよい。距離推定器は、スピーカアレイと聴取者との間の距離を検出する。この検出された距離に基づき、指向性補償器は、既定の直接対反響サウンドエネルギー比を維持するスピーカアレイによって生成されたビームから指向性指標を算出する。アレイプロセッサは、算出された指向性指標を受信し、その算出された指向性指標を有するビームパターンを生成するようにスピーカアレイ内のトランスデューサのうちの1つ以上を駆動させるオーディオ信号のセットを生成するために、1つのサウンドプログラムコンテンツの各チャネルを処理する。
一般に、マルチチャネルオーディオデータをキャプチャすることに関して技術が説明される。1つまたは複数のプロセッサを備えるデバイスは、技術を実施するように構成され得る。プロセッサは、オーディオオブジェクトを識別するために、キャプチャされたオーディオデータを解析し、ビデオオブジェクトを識別するために、オーディオデータのキャプチャと同時にキャプチャされたビデオデータを解析し得る。プロセッサは、次いで、オーディオオブジェクトのうちの少なくとも1つをビデオオブジェクトのうちの少なくとも1つと関連付け、ビデオオブジェクトのうちの少なくとも1つとのオーディオオブジェクトのうちの少なくとも1つとの関連付けに基づいて、オーディオデータからマルチチャネルオーディオデータを生成し得る。
【選択図】図1B
モバイルデバイス内でのスピーカ等化のための装置および方法が開示される。一実施形態では、スピーカを含むモバイルデバイスの配置状態が判定され、判定された配置状態に従って、スピーカ等化が実施される。
オーディオ・オブジェクトが動くことができる体積について複数の仮想源位置が定義されてもよい。オーディオ・データをレンダリングするためのセットアップ・プロセスは、再生スピーカー位置データを受領して、該再生スピーカー位置データおよび各仮想源位置に従って各仮想源についての利得値を事前計算することに関わっていてもよい。利得値は、記憶され、再生環境のスピーカーのためにオーディオ再生データがレンダリングされる「ランタイム」の間に使われてもよい。ランタイムの間に、各オーディオ・オブジェクトについて、オーディオ・オブジェクト位置データおよびオーディオ・オブジェクト・サイズ・データによって定義される領域または体積内の仮想源位置からの寄与が計算されてもよい。少なくとも部分的には該計算された寄与に基づいて、再生環境の各出力チャネルについて一組の利得値が計算されてもよい。各出力チャネルは、再生環境の少なくとも一つの再生スピーカーに対応してもよい。
To top