University of Electro-Commnunications

Zhang Laboratory

Department of Computer and Network Engineering

Multimedia signal processing

マルチメディア信号処理に関する研究


 マルチメディア信号処理技術の高度化に伴い,音声や画像などの実時間信号処理が実用化されており,高精細TV、スマートフォンやデジタル家電といった形で、一般消費者の生活の中にも溶け込んできている.また,2020年東京オリンピックを目指す8Kスーパーハイビジョンの本放送に向けた技術開発も精力的に進められ,インターネットでの音楽やビデオ配信など,その可能性がますます広がっていく.マルチメディア信号処理技術は,高度情報化社会にとって,欠かせない重要な技術の一つである.当研究室では,マルチメディア信号処理に関する研究を多角的に行っている.(卒研配属HP)

基礎理論に関する研究


フィルタ設計、最適化、近似理論

 フィルタは,信号処理の基本的かつ重要な処理手段の一つである.ディジタルフィルタでは, ディジタル信号を対象とするために,通常の線形処理に限らず,時変的、非線形処理も可能であり,適応性に富む柔軟な処理が容易に実現できる.ディジタルフィルタには,FIRフィルタとIIRフィルタがある.FIRフィルタは,常に安定で,線形位相が容易に実現できる.一方,IIRフィルタは,比較的に低次数で急峻な振幅特性を達成できる.フィルタ設計は,所望特性にフィルタの周波数特性を近似し,最適なフィルタ係数を見付ける最適化問題である.最大平坦(バターワース)や等リプル(チェビシェフ)近似などの様々な設計法がある.

マルチレート信号処理、フィルタバンク

 アナログ信号をサンプリング(標本化)してディジタル信号に変換する処理は,A/D変換という.A/D変換で異なるサンプリングレートより得られたディジタル信号は,マルチレート信号である.例えば,異なる解像度をもつ画像がその一つの例である.マルチレート信号処理は,フィルタリングを通してマルチレート信号間の変換(レートの上げ下げ)を行う処理である.画像の場合,サイズの拡大縮小という処理である.また,フィルタバンクは複数個のフィルタを組み合わせたものである.各フィルタにより信号を幾つかの周波数成分(低周波数,高周波数,...)に分割し,それぞれの成分を解析・処理した後,信号を再合成する.この多チャネルフィルタバンクについて現在盛んに研究され,その設計が重要である.

ウェーブレット変換、時間周波数解析

 ウェーブレット変換は,完全再構成フィルタバンクと緊密な関係にあり,フィルタバンクを用いることで効率的に実現できる.ウェーブレット変換は,従来のフーリエ変換では不可能であった時間と周波数領域の同時解析が可能であり,多重解像度空間において信号を解析することができ,音声や画像処理などの様々な分野で幅広く応用されている.また,ウェーブレット変換は,従来のフーリエ変換と比較して基底の選択に自由度があり,目的に応じたウェーブレット基底を選ぶことが可能である.ウェーブレット基底の構成は,対応する完全再構成フィルタバンクの設計であり,様々な制約条件を満たすウェーブレットフィルタバンクの設計が重要である.

グラフ信号処理

 ソーシャルネットワーク、センサーネットワーク、ニューラルネットワークや交通網などを含む様々なネットワークから集められた膨大な量のデータ,すなわち,ビッグデータの処理や解析は非常に重要な課題の一つである. ネットワーク上に存在する高次元データは,一般的に信号数が非常に多く,また複雑な構造を持つ. グラフ信号処理の目的は,ネットワーク上に定義されたデータをグラフ信号として捉え,従来の信号処理理論から信号処理の概念や方法などをグラフ信号処理へ拡張し,グラフの構造を利用して膨大な量のデータを効率よく処理するアルゴリズムの開発である.

応用に関する研究


静止画像圧縮、動画像圧縮

 ウェーブレット変換は,既に様々な分野で幅広く応用されている.最も成功した応用例の一つは静止画像圧縮である.静止画像圧縮の国際標準JPEG 2000に,ウェーブレット圧縮技術が既に取り入れられている.従来の静止画像圧縮国際標準JPEGと動画像圧縮国際標準MPEGは,DCT(離散コサイン変換)を使用するため,圧縮率が高い時,再生画像にプロック歪が生じ,画質が劣化する.また,JPEG, MPEGはロシー圧縮であり,ロスレス圧縮のためには別の方式を使わなければならない.一方,JPEG 2000では,ウェーブレット変換を用いることで,プロック歪がなく,優れた圧縮性能を達成でき,さらにそれぞれに対応するウェーブレットフィルタバンクを用いることでロシー・ロスレス圧縮の両方が可能である.当研究室では,オールパスフィルタを用いた新しいウェーブレットフィルタバンクの設計に成功し,それを静止画像圧縮に応用したロシー・ロスレス統一符号化を開発した.そのロシー・ロスレス圧縮性能はJPEG 2000より改善した.ウェーブレット変換を動画像圧縮にも応用することが試みられている.ウェーブレット変換を用いた動画圧縮標準としてMotion JPEG 2000がある.Motion JPEG 2000は動画像の各フレームをJPEG 2000で圧縮したものである.各フレームが独立であるため編集が容易であるが,圧縮率は低い.そこで,フレーム間の相関を利用した圧縮を行うために,時間方向にもウェーブレット変換を適用する研究が行われている.フレーム内と時間方向のそれを併せて3次元ウェーブレット変換と呼んでおり,当研究室でも更なる圧縮性能向上を目指して研究を行っている.

ノイズ除去、フリッカー低減

 信号に雑音(ノイズ)が混入する場合がしばしばある.その雑音を除去して信号のみを抽出することが必要である.ノイズ除去にはたくさんの手法が提案されいる.ウェーブレット変換の応用として,ランダムノイズの除去を目的とするウェーブレット縮退法がある.当研究室では,ウェーブレット縮退法をMotion JPEG 2000のフリッカー低減に応用する研究を行っている.Motion JPEG 2000は動画像の各フレームをJPEG 2000で圧縮する動画像コーデックである.JPEG 2000ではウェーブレット変換が使用され,そのウェーブレット変換がシフト不変でない欠点を持つ.そのため,圧縮率が高い時,再生動画像につらつき(フリッカー)が生じる問題がある.そこで,再生時に動画像の時間方向にウェーブレット縮退を適用することで,フリッカーを低減する.

錯視画像解析

 人間は周囲の状況を視覚、聴覚といった五感を用いて知覚する.その際,実在する対象と人間が知覚するものとが一致しない場合,それを錯覚と呼ぶ.そして錯覚のうち,特に視覚におけるものを錯視という.錯視には色々な種類がある.例えば,明暗錯視の代表的なものであるチェッカー・シャドー錯視、運動錯視である蛇の回転など.視覚系に関する研究は古くから行われているが,その詳細な情報処理メカニズムは未だに解明されていない.そこで錯視を足がかりとして,そのメカニズムを解明するということが行われている.錯視は特別な状況下でのみ生じるものではなく,視覚情報処理の一部が極端な例として現れたものと考えられ,その錯視が生じるメカニズムを解明できれば,視覚系を解明することに繋がる.当研究室では,多チャネル方向選択性フィルタバンクを用いた錯視画像解析について研究を進めている.

画像フュージョン

 画像フュージョンとは,複数の異なる情報を持つ画像を合成してすべての情報を統合した一枚の画像を作ることである.例えば,ピントのずれた複数の画像から,ピントがすべて合った一枚の画像を合成する.近年,医療画像や多重センサーの使用により,画像フュージョンはますます重要な技術になってきている.当研究室では,マルチスケール分解(MSD)による画像フュージョンについて研究を行っている.マルチスケール分解は,ラプラシアンピラミッド変換(LPT)やウェーブレット変換(DWT)などにより,元画像をマルチスケール画像に分解することである.これによって得られた分解画像に対し,フュージョンルールに沿って画像を合成し,これを逆マルチスケール変換することで目的の合成画像が得られる.複数の入力画像を,歪みや情報の損失無しにフュージョンしなければならないため,用いるマルチスケール変換や,よりよいフュージョンルールについて考えていくことが必要である.

TOP