フィルターバンク: コンピューター ビジョンのフィルター バンク技術に関する洞察
By Fouad Sabry
()
About this ebook
フィルタ バンクとは
フィルタ バンクは、信号処理で使用されるバンドパス フィルタの配列です。 その目的は、入力信号をいくつかのコンポーネントに分割し、それぞれが元の信号のサブバンドを伝送することです。 新しい方法でコンポーネントを減衰し、元の信号の修正バージョンに再結合することは、フィルター バンクのアプリケーションの 1 つです。 グラフィック イコライザーは、このタイプのアプリケーションの一例です。 分析結果はサブバンド信号と呼ばれ、フィルター バンク内のフィルターの数と同じ数のサブバンドが含まれます。 フィルター バンクによって実行される分解のプロセスは、分析と呼ばれます。 合成とは、再構築のプロセスを説明するために使用される用語で、フィルタリング プロセスによって生成された完全な信号を再構築する行為を指します。
メリット
(I) 次のトピックに関する洞察と検証:
第 1 章: フィルター バンク
第 2 章: 離散フーリエ変換
第 3: デジタル フィルター
第 4 章: ウェーブレット
第 5 章: 修正離散コサイン変換
第 6 章: 有限インパルス応答
第5 章 7: ドーベシー ウェーブレット
第 8 章: 離散ウェーブレット変換
第 9 章: 離散時間フーリエ変換
第 10 章: ダウンサンプリング (信号処理)
(II) フィルター バンクに関する一般のよくある質問に答えます。
(III) 多くの分野でフィルター バンクを使用する実際の例。
誰 この本は、
専門家、学部生および大学院生、愛好家、愛好家、およびあらゆる種類のフィルター バンクに関する基本的な知識や情報を超えたいと考えている人を対象としています。
Related to フィルターバンク
Titles in the series (100)
ヒストグラム均等化: 画像のコントラストを強化して視覚認識を強化 Rating: 0 out of 5 stars0 ratingsガンマ補正: コンピューター ビジョンの視覚的な鮮明さを高める: ガンマ補正技術 Rating: 0 out of 5 stars0 ratingsコンピュータステレオビジョン: コンピュータービジョンにおける奥行き知覚の探求 Rating: 0 out of 5 stars0 ratings異方性拡散: 異方性拡散による画像解析の強化 Rating: 0 out of 5 stars0 ratingsトーンマッピング: トーン マッピング: コンピューター ビジョンにおける視点を照らす Rating: 0 out of 5 stars0 ratings水中コンピュータビジョン: 波の下でコンピューター ビジョンの深さを探索する Rating: 0 out of 5 stars0 ratings画像ヒストグラム: 視覚的な洞察を明らかにし、コンピューター ビジョンの画像ヒストグラムの深さを探る Rating: 0 out of 5 stars0 ratingsアフィン変換: 視覚的な視点を解き放つ: コンピューター ビジョンにおけるアフィン変換の探索 Rating: 0 out of 5 stars0 ratingsレティネックス: レティネックスでコンピュテーショナル ビジョンの秘密を明らかにする Rating: 0 out of 5 stars0 ratings視覚: 計算による視覚処理に関する洞察 Rating: 0 out of 5 stars0 ratings修復: コンピュータビジョンにおけるギャップを埋める Rating: 0 out of 5 stars0 ratings画像圧縮: ビジュアルデータ最適化のための効率的なテクニック Rating: 0 out of 5 stars0 ratingsコンピュータビジョン: コンピュータービジョンの深部を探る Rating: 0 out of 5 stars0 ratingsハフ変換: コンピューター ビジョンにおけるハフ変換の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsエッジ検出: コンピュータービジョンの境界を探索する Rating: 0 out of 5 stars0 ratings色空間: コンピューター ビジョンのスペクトルを探索する Rating: 0 out of 5 stars0 ratingsラドン変換: ビジュアルデータに隠されたパターンを明らかにする Rating: 0 out of 5 stars0 ratingsフィルターバンク: コンピューター ビジョンのフィルター バンク技術に関する洞察 Rating: 0 out of 5 stars0 ratings共同写真専門家グループ: 共同写真専門家グループ規格でビジュアルデータの力を解き放つ Rating: 0 out of 5 stars0 ratingsハリスコーナーディテクター: 画像特徴検出の魔法を明らかにする Rating: 0 out of 5 stars0 ratingsアダマール変換: コンピューター ビジョンにおけるアダマール変換の力を明らかにする Rating: 0 out of 5 stars0 ratings人間の視覚系モデル: 知覚と処理を理解する Rating: 0 out of 5 stars0 ratingsノイズ減少: 明瞭度の向上、コンピュータ ビジョンのノイズ低減のための高度な技術 Rating: 0 out of 5 stars0 ratings方向性のある勾配ヒストグラム: 視覚的領域の解明: コンピューター ビジョンでの指向性勾配ヒストグラムの探索 Rating: 0 out of 5 stars0 ratingsホモグラフィー: ホモグラフィー: コンピューター ビジョンの変換 Rating: 0 out of 5 stars0 ratingsカラーマッチング機能: コンピュータビジョンにおける分光感度を理解する Rating: 0 out of 5 stars0 ratings輪郭検出: コンピュータービジョンにおける視覚認識の技術を明らかにする Rating: 0 out of 5 stars0 ratingsカラーモデル: コンピューター ビジョンのスペクトルを理解する: カラー モデルを探索する Rating: 0 out of 5 stars0 ratingsランダムサンプルのコンセンサス: コンピュータビジョンにおけるロバスト推定 Rating: 0 out of 5 stars0 ratingsブロブの検出: ビジュアルデータのパターンを明らかにする Rating: 0 out of 5 stars0 ratings
Related ebooks
シェーダ: シェーダーによる視覚領域の探索: コンピューター ビジョンへの旅 Rating: 0 out of 5 stars0 ratingsマイクロソフト ピクセルセンス: 視覚センシングによる人間とコンピュータのインタラクションに革命を起こす Rating: 0 out of 5 stars0 ratingsカラープロファイル: コンピューター ビジョンにおける視覚認識と分析の探求 Rating: 0 out of 5 stars0 ratings適応フィルタ: 適応フィルタリングによるコンピュータビジョンの強化 Rating: 0 out of 5 stars0 ratingsラジオシティ コンピュータ グラフィックス: コンピュータビジョンにおけるラジオシティによる視覚化の進歩 Rating: 0 out of 5 stars0 ratings3次元コンピュータグラフィックス: ビジョンと仮想世界の交差点を探索する Rating: 0 out of 5 stars0 ratings旋盤グラフィックス: コンピューター ビジョンによる旋盤グラフィックスの視覚操作の探求 Rating: 0 out of 5 stars0 ratingsアンチエイリアシング: コンピュータービジョンの視覚的な鮮明さを強化する Rating: 0 out of 5 stars0 ratingsボリュームレンダリング: コンピュータービジョンにおける視覚的リアリズムの探求 Rating: 0 out of 5 stars0 ratingsマルチスペクトルイメージング: スペクトルのロックを解除: コンピューター ビジョンの進歩 Rating: 0 out of 5 stars0 ratingsデジタルビデオフィンガープリンティング: ビジュアルデータのセキュリティと識別を強化する Rating: 0 out of 5 stars0 ratingsバーチャルエコノミー: デジタルゴールドラッシュ、仮想経済をナビゲートする Rating: 0 out of 5 stars0 ratingsデジタルラスターグラフィックス: コンピューター ビジョンにおけるデジタル ラスター グラフィックスの威力を明らかにする Rating: 0 out of 5 stars0 ratings拡張現実支援手術: コンピュータービジョンによる手術の精度の向上 Rating: 0 out of 5 stars0 ratingsノイズ減少: 明瞭度の向上、コンピュータ ビジョンのノイズ低減のための高度な技術 Rating: 0 out of 5 stars0 ratingsビサージュ・ソフトウェア開発キット: 顔立ち ソフトウェア開発キット でコンピューター ビジョンのイノベーションを強化 Rating: 0 out of 5 stars0 ratings異方性拡散: 異方性拡散による画像解析の強化 Rating: 0 out of 5 stars0 ratings色空間: コンピューター ビジョンのスペクトルを探索する Rating: 0 out of 5 stars0 ratingsブロブの検出: ビジュアルデータのパターンを明らかにする Rating: 0 out of 5 stars0 ratingsカラーマネジメントシステム: デジタル環境における視覚認識の最適化 Rating: 0 out of 5 stars0 ratingsレイ トレーシング グラフィックス: コンピューター ビジョンにおけるフォトリアリスティックなレンダリングの探求 Rating: 0 out of 5 stars0 ratings要素コスト: 要素コストが明らかになり、明確かつ自信を持って経済学をナビゲート Rating: 0 out of 5 stars0 ratings衝突検知: コンピュータビジョンにおける視覚的交差を理解する Rating: 0 out of 5 stars0 ratingsピープルカウンター: ビジュアル分析を通じて洞察を引き出す Rating: 0 out of 5 stars0 ratings文脈に応じた画像分類: 効果的な分類のための視覚データの理解 Rating: 0 out of 5 stars0 ratings画像ヒストグラム: 視覚的な洞察を明らかにし、コンピューター ビジョンの画像ヒストグラムの深さを探る Rating: 0 out of 5 stars0 ratings都市の先見者: 都市の先見者と都市生活の再生、ジェーン・ジェイコブスの遺産を解き明かす Rating: 0 out of 5 stars0 ratingsエッジ検出: コンピュータービジョンの境界を探索する Rating: 0 out of 5 stars0 ratingsキャニーエッジ検出器: 視覚認識の芸術を明らかにする Rating: 0 out of 5 stars0 ratings虹彩認識: コンピューター ビジョンにおける虹彩認識に関する明るい視点 Rating: 0 out of 5 stars0 ratings
Reviews for フィルターバンク
0 ratings0 reviews
Book preview
フィルターバンク - Fouad Sabry
第1章:フィルターバンク
フィルタバンク(またはフィルタバンク)は、信号処理で使用されるバンドパスフィルタの集合体で、入力信号を多数のチャンネルに分割し、各チャンネルに個別の周波数帯域を伝送します。グラフィック・イコライザーは、フィルタ・バンクを使用して個々の信号成分を減衰させ、信号全体を変化させるように再結合します。各サブバンドの成分に関して信号を分析することは、フィルターバンクが信号を分解するときに行うことであり、結果として得られる信号には、バンク内のフィルターと同じ数のサブバンドがあります。合成とは、フィルタリングが適用された後に信号全体を再作成するプロセスを指します。
受信機のグループは、デジタル信号処理では「フィルタバンク」と呼ばれることがあります。ただし、受信機はサブバンドを低い中心周波数にダウンコンバートして、より低いレートで再サンプリングできるようにします。場合によっては、バンドパスサブバンドをアンダーサンプリングすることで同じ効果を得ることができます。
信号内の一部の周波数が他の周波数よりも重要な場合は、フィルターバンクを使用して信号を圧縮できます。分解により、重要な周波数を高精度に符号化することができます。これらの周波数では、微小な変動も保持する符号化技術が必要です。ただし、マイナー周波数は少しずれている可能性があります。より細かい(ただし関連性の低い)特徴を犠牲にできる場合は、より粗いコーディングスキームを利用できます。
ボコーダーは、モジュレーターのサブバンド振幅情報を使用してキャリア信号のサブバンドの振幅を調整することにより、モジュレーターの動的特性をキャリア信号に課すことによって機能します。この場合の変調器信号は音声です。
一部のフィルターバンクは、ほぼ時間領域でのみ動作し、直交ミラーフィルターやゲルツェルアルゴリズムなどの一連のフィルターを介して信号を離散的な周波数帯域に分割します。フーリエ変換は、他のフィルター バンク (FFT) ですぐに使用されます。
入力データストリームの重なり合うチャンクに一連のFFTを適用すると、レシーババンクが得られます。
各セグメントには、フィルタの周波数応答を調整するための独自の重み付け関数(またはウィンドウ関数)が与えられます。
形式が広ければ広いほど、ナイキスト・サンプリングの要件を満たすためにFFTを実行する必要がある頻度が高くなります。
セグメント長が一定であれば、FFTはオーバーラップの量に比例したレートで実行されます(その逆も同様です)。
また、円形のフィルター形状が多いほど、必要な入力帯域幅分割フィルターが少なくなります。
余分な手順 (.
周波数デシメーション)は、各重み付きセグメントを一連のブロックとして考え、ブロックの合計だけをFFTの対象とすることで、迅速かつ簡単に行うことができます。
重み重なり加算 (WOLA) と重み付きプリサム高速フーリエ変換 (FFT) は、この手法の 2 つの名前です。
(§ DTFTのサンプリングを参照)
ブロックの長さがFFT間の時間の整数倍になるように計画されている場合、特定のケースがあります。その後、1つ以上の多相フィルタ構造(単純な加算ではなくFFTによって位相が再結合される)を使用して、FFTフィルタバンクの特性評価を行うことができます。フィルターのインパルス応答の長さ (または深さ) は、特定のセグメント内のブロック数に等しくなります。汎用プロセッサでは、FFTと多相構造の計算効率は同等です。
各受信機の出力を所望の帯域幅に比例したレートでアップサンプリングし、各チャンネルを新しい中心周波数に変換し、サンプルのストリームを合計するだけで、合成(つまり、多くの受信機の出力の再結合)が構成されます。この設定では、アップサンプリング関連の補間フィルターを合成フィルターと呼びます。各チャンネルの正味周波数応答は、合成フィルターの応答にフィルターバンクの応答(解析フィルター)を乗算して計算されます。隣接するチャネルの周波数応答の合計では、すべての周波数でチャネルの中心間に一定の値があることが好ましい。私たちはこの状況を「完全復興」と呼んでいます。
フィルター バンクは、時間-周波数信号処理のコンテキストでは、特定の 2 次時間-周波数分布 (TFD) の形式で信号の結合時間-周波数領域表現です。これは、二次(または双一次)時間-周波数分布のクラスを記述し、2次元フィルタリングを介してウィグナー・ヴィル分布に関連しています。スペクトログラムは時間領域をスライスしてからフーリエ変換を実行することによって得られますが、フィルタバンクは周波数領域をスライスし、目的の信号によって励起されるバンドパスフィルタを形成することによって得られます。どちらの方法でも 2 次 TFD が得られますが、フィルター バンクとスペクトログラムは実装が最も簡単です。
信号は、周波数帯域の幅に応じてさまざまな速度で解析できるマルチレート フィルター バンクを使用して複数のバンドに分割されます。
インプリメンテーションでは、ダウンサンプリング (デシメーション) とアップサンプリング (エクスパンション) が使用されます。
変換領域でのこれらの操作の効果の詳細については、「離散時間フーリエ変換 § プロパティ」および「Z 変換 § プロパティ」を参照してください。
別の言い方をすれば、狭いローパスフィルターは、通過帯域が比較的小さいフィルターです。時不変 FIR フィルターの代わりに、ローパス アンチエイリアシング フィルター、デシメーター、インターポレーター、およびローパス アンチイメージング フィルターを使用すると、マルチレートの狭いローパス FIR フィルターが得られます。デシメータとインターポレータは、マルチレート システムを可変時定数をもつ線形位相フィルタに変換します。ローパスフィルタは、インターポレータ多相フィルタとデシメータ多相フィルタで構成されています。
フィルター バンクは、入力信号を x\left(n\right) 一連の信号に分割します x_{{1}}(n),x_{{2}}(n),x_{{3}}(n),... 。
このようにして、生成された各信号は、 のスペクトルの異なる領域に対応します x\left(n\right) 。
この手順では、提出物に基づいてゾーンが重複する可能性があります)。
生成された信号 x_{{1}}(n),x_{{2}}(n),x_{{3}}(n),... は、帯域幅と中心周波数(それぞれ) {\displaystyle {\rm {BW_{1},BW_{2},BW_{3},...}}} を持つバンドパスフィルターのセットを介して生成できます f_{{c1}},f_{{c2}},f_{{c3}},... 。
1 つの入力信号をフィルター処理してサブサンプリングすることにより、マルチレート フィルター バンクは、さまざまなレートで多数のバージョンの信号を生成します。
同じ入力信号から 2 つ以上の異なる出力信号を作成する (解析合成ツールの使用)。
信号は H_{{k}}(z) 、k =0,1,2,3 の 4 つのフィルターを使用して、同じ帯域幅の 4 つのバンド (解析バンク内) に分割され、各サブ信号は 4 倍に間引かれます。
各帯域の伝送は構成周波数に分割され、信号は異なって見えます。
フィルターの合成機能では、初期信号を再作成し、まず、プロセッシング ユニットの出力で 4 つのサブ信号を 4 倍にアップサンプリングし、次に F_{{k}}(z) k = 0,1,2,3 の 4 つの合成フィルターでフィルターします。
最後に、これら 4 つのフィルターの結果を追加します。
従来の完全な再構成特性に加えて、離散時間フィルタバンクフレームワークにより、入力信号に依存する特徴を組み込むことができます。
最大エネルギー圧縮などの情報理論の領域からの特徴、理想的なフィルタバンクは、サブバンド信号の完全な非相関と、指定された入力共分散/相関構造のその他の特徴を持つように設計されています。
これらのフィルター バンクは、基底関数 (フィルター) の長さ L と部分空間次元 M が同じである最適なブロック変換である信号依存の Karhunen–Loève 変換 (KLT) に似ています。
マルチレート システムとフィルター バンクは、主に多次元フィルター処理、ダウンサンプリング、およびアップサンプリングで構成されます。
解析側と合成側の両方がフル・フィルタ・バンクを構成します。
入力信号は、解析フィルターバンクを使用して、異なる周波数範囲のサブバンドに分離されます。
合成フェーズでは、個々のサブバンド信号がつなぎ合わされて新しい信号が作成されます。
デシメータとエキスパンダは、2つの基本的なコンポーネントです。
たとえば、入力は 4 つの個別のサブバンド (方向) に分割され、それぞれが周波数ゾーンの 1 つをカバーし、ウェッジとして表示されます。
1次元システムでは、Mの倍数であるサンプルのみがM倍デシメータによって保持されます。残りは捨てられます。
一方、多次元システムでは、デシメータはD×Dの非特異整数行列です。
デシメータが生成した格子上にあるサンプルのみが考慮されます。
一般的に使用されるデシメータはクインカンクスデシメータであり、その格子は次のように定義されるクインカンクス行列から生成されます。 {\displaystyle {\begin{bmatrix}\;\;\,1&1\\-1&1\end{bmatrix}}}
ここでは、クインカンクス行列を使用して構築できるクインカンクス格子を示します。分析が合成をミラーリングする方法に似ています。
サブバンド分解と再構成は、バンクのフィルター処理に使用できる 2 つの周波数領域メトリクスです。
ただし、同様に重要なのは、ヒルベルト空間のフィルターバンクの理解であり、信号の幾何学的表現において重要です。
ユビキタスなKチャネル用のフィルターバンク、解析フィルター \left\{h_{{k}}[n]\right\}_{{k=1}}^{{K}} 、合成フィルター、 \left\{g_{{k}}[n]\right\}_{{k=1}}^{{K}} サンプリングマトリックス \left\{M_{{k}}[n]\right\}_{{k=1}}^{{K}} 。
研究面では、ベクトルを次のように定義できます {\displaystyle \ell ^{2}(\mathbf {Z} ^{d})} 。
{\displaystyle \varphi _{k,m}[n]{\stackrel {\rm {def}}{=}}h_{k}^{*}[M_{k}m-n]} 、2 つのパラメーター と による各インデックス。 {\displaystyle 1\leq k\leq K} {\displaystyle m\in \mathbf {Z} ^{2}}
同様に、合成フィルターについては、 を g_{{k}}[n] 定義できます {\displaystyle \psi _{k,m}[n]{\stackrel {\rm {def}}{=}}g_{k}^{*}[M_{k}m-n]} 。
解析/合成側の定義を考慮すると、再 {\displaystyle c_{k}[m]=\langle x[n],\varphi _{k,m}[n]\rangle } 構成部分では次のことを検証できます。
{\displaystyle {\hat {x}}[n]=\sum _{1\leq k\leq K,m\in \mathbf {Z} ^{2}}c_{k}[m]\psi _{k,m}[n]}.
別の言い方をすれば、入力信号と解析セットベクトルは、解析フィルタバンクによって内積化されます。さらに、合成セット ベクトルの組み合わせで再構成された信号と、計算された内積の組み合わせ係数は、次のことを意味します。
{\displaystyle {\hat {x}}[n]=\sum _{1\leq k\leq K,m\in \mathbf {Z} ^{2}}\langle x[n],\varphi _{k,m}[n]\rangle \psi _{k,m}[n]}何かを分解して元に戻すプロセスが損傷を引き起こさない場合、フィルターのバンクに付けられた名前は「完全な再構築」です。
(その場合、. x[n]={\hat {x[n]}}
図は、汎用の N チャネル、M 行 N 列の多次元フィルター バンクを示しています。
解析部分は、入力信号を x[n] N 個のフィルター処理およびダウンサンプリングされた出力に変換します y_{{j}}[n], j=0,1,...,N-1 。
合成部分は、 y_{{j}}[n] アップサンプリングとフィルタリングによって元の信号を回復します。
サブバンド符号化は、この構成の多くの用途の1つに過ぎず、マルチチャネル取得、離散的なウェーブレット変換を伴う。
多相表現は便利なツールであるため、入力信号 x[n] はその多相成分のベクトルで表すことができます
{\displaystyle x(z){\stackrel {\rm {def}}{=}}(X_{0}(z),...,X_{|M|-1}(z))^{T}}。
を表す
{\displaystyle y(z){\stackrel {\rm {def}}{=}}(Y_{0}(z),...,Y_{|N|-1}(z))^{T}.}したがって y(z)=H(z)x(z) 、 H_{{i,j}}(z) はフィルターの j 番目の多相成分を表します H_{{i}}(z) 。
同様に、出力信号の場合、 になります {\hat {x}}(z)=G(z)y(z) 。
{\displaystyle {\hat {x}}(z){\stackrel {\rm {def}}{=}}({\hat {X}}_{0}(z),...,{\hat {X}}_{|M|-1}(z))^{T}}また、G は行列であり、ここで G_{{i,j}}(z) j 番目の合成フィルター Gj(z) の i 番目の多相成分を表します。
フィルタバンクは、任意の入力に対して x(z)={\hat {x}}(z) 完全な再構成を行う I_{{|M|}}=G(z)H(z) か、G(z)がH(z)の左逆数であることを意味します。
今日まで、1次元フィルタバンクは高度に洗練されてきました。画像、ビデオ、3Dサウンド、レーダー、ソナーはすべて、特殊なフィルターバンクの開発を必要とする多次元信号の例です。
データの送受信速度が速くなると、信号処理システムの処理、送信、受信の各段階でより多くのストレージスペースが必要になります。マルチレートサンプリング技術は、処理する必要があるデータの量を制限するために開発され、時間、スペース、およびエネルギーを節約します。フィルタバンクには、画像符号化、音声符号化、レーダーなど、いくつかのアプリケーションがあります。
研究者は、1Dフィルターに関する多くの問題を広範囲に調査し、1Dフィルターバンクを設計するための多数の戦略を提示してきました。しかし、多次元フィルタバンクの設計には、まだ多くの未解決の問題があります。一部のアプローチでは信号を適切に再構築できない可能性がありますが、他のアプローチは複雑または煩雑すぎて実用的ではありません。
デシメーション行列が対角線で、データが各次元で個別に処理される場合、ツリートポロジで1Dフィルタバンクをカスケード接続するだけで、多次元フィルタバンクを設計できます。個別のシステムとは、分解して再組み立てできるシステムです。ただし、フィルター バンクのサポートは、地理的に離散的ではない場合があります。このような状況では、フィルタバンクの設計がより複雑になります。ほとんどの場合、私たちが扱うシステムは統合されています。