画像電子学会誌　論文・資料アブストラクト
第２６巻　第６号（１９９７年１２月）

モーバイル・コンピューティングとコミュニケーションのためのプラットフォーム

松下温（慶応義塾大学理工学部）
重野寛（慶応義塾大学大学院理工学研究科）

小型の計算機を持ち運び，移動体通信網を利用して計算機ネットワークを接続して使用するといった，モーバイル・コンピューティングが可能となってきた．モーバイル・コンピューティング環境では，通信回線の切断や接続不可能な状態といった有線通信にはない無線通信特有の問題が生じる．また，ユーザは携帯している計算機のみならず，場所に応じて異なる計算機を使用することが考えられる．本稿では，モーバイル・コンピューティングの特徴を考慮したMobile Computing and Communication (MC2) Platformを提案する．本プラットフォームは，無線通信の欠点を補い，ユーザのモビリティをサポートするエージェントが動作する環境を提供する．キーワード：モーバイル・コンピューティング，エージェント・プラットフォーム，モーバイル電子メール

Multi-Mode Wireless Videophony

Lajos Hanzo(Dept. of Electr. and Comp. Sc., Univ. of Southampton)
Jurgen Streit(Dept. of Electr. and Comp. Sc., Univ. of Southampton)

A comparative study of arbitrarily programmable, but fixed-rate videophone codecs using quarter common intermediate format (QCIF) video sequences scanned at 10 frames/s is offered. These codecs were designed to allow direct replacement of mobile radio voice codecs in second generation wireless systems, such as the Pan-European GSM, the American IS-54 and IS-95 as well as the Japanese systems, operating at 13, 8, 9.6 and 6.7 kbps, respectively, although better video quality is maintained over higher-rate, 32 kbps cordless systems, such as the Japanese PHS and the European DECT and CT 2 systems. Best overall performance was achieved by our vector-quantised codecs, followed by the discrete cosine transformed and the quad-tree-based schemes, which were characterised by the bitallocation schemes of Table 1. The associated video Peak Signal-to-Noise Ratio (PSNR) was around 30 dB, while the subjective quality can be viewed under http://www-mobile.ecs.soton.ac.uk. A range of multimode wireless transceivers were also proposed, which are characterised by Table 2.

携帯型マルチメディア通信システムにおける可変フレーム長再送制御方式の検討

坂巻知樹（ＮＴＴヒューマンインタフェース研究所）
茨木久（ＮＴＴヒューマンインタフェース研究所）
木村司（ＮＴＴヒューマンインタフェース研究所）
富田靖浩（ＮＴＴヒューマンインタフェース研究所）
市川忠嗣（ＮＴＴヒューマンインタフェース研究所）
島村和典（ＮＴＴヒューマンインタフェース研究所）

ディジタル無線技術の発展，CPUの小型・高速化，LSIの高集積化などにより，マルチメディアデータによる携帯型サービスの提供が可能となりつつある．特に1995年に音声サービスを開始したPHS（Personal Handy Phone System）がディジタルベアラ伝送サービスを始めたのに伴い，移動通信網を対象としたオーディオビジュアル通信システムの開発が活発化している．無線伝送路を用いて画像情報を伝送する際には，伝送誤りによって画像品質が劣化することが大きな問題となるため，ディジタル無線伝送路を用いたマルチメディア通信では自動再送制御（Automatic recovery quotient：ARQ）や誤り訂正符号（Forward error correction：FEC）などの方法により伝送誤りに対する耐性を強化する方法が検討されている．本論文では，伝送誤り耐性技術の中でも簡単な構成で実現可能な自動再送制御方式に着目し，より高効率な通信を実現するために，無線伝送路での伝送誤りの発生パターンを利用してフレーム長を適応的に変更する誤り再送方式について検討した．また，プロトタイプを用いた実環境における評価実験を行い，本方式によるマルチメディア通信品質の改善効果についても述べている．

シーン内のテキストの認識および翻訳

渡辺靖彦（龍谷大学理工学部電子情報学科）
岡田至弘（龍谷大学理工学部電子情報学科）
金淵培（ＮＨＫ放送技術研究所先端制作技術研究部）
武田哲也（龍谷大学理工学部電子情報学科）

シーン中のテキストには命令，注意，説明，名称など重要な情報を表すものがある．しかし，こうした重要な情報も，日本語のみで表示されることが多く，日本語のわからない人にはその内容を理解するのはむずかしい．そこで，われわれは，ディジタルカメラで撮影したシーンからテキストをよみだし，それを機械翻訳してユーザに示すことを提案する．キーワード　機械翻訳，画像処理，文字認識，マルチメディア

視点視野に基づいた画像のプログレッシブ符号化手法

井門俊（東京工業大学精密工学研究所）
佐藤誠（東京工業大学精密工学研究所）

筆者らは，従来のプログレッシブJPEG手法を拡張し，ブロック優先符号化手法を提案した．これは，人間の初期視覚にとって重要な刺激情報に基づいて，画像を分割するブロックに伝送表示の優先度を設定し，段階的復号化の際に，画像把握に重要な領域を優先的に伝送表示できるようにするというものである．ブロック優先符号化手法は，画像データベースの検索場面などにおいて，従来の段階的符号化手法と比較して，効率の良い画像表示ができ，より早期の画像把握を可能とする．本論文では，このブロック優先機能に加え，視点視野の機能を考慮した画像符号化手法を提案する．本手法によって，人間の視覚系にとってより自然な段階的表示が可能となる．人物画像の復号化実験において，画像表示のときの視覚的な効果を確認した．キーワード：段階的画像符号化，視点視野，初期視覚，プログレッシブJPEG，画像検索，マルチメディア

4次中心モーメントに基づく画像の多値化におけるクラス数の自動判別基準

郭素梅（慶応義塾大学電気工学科）
小沢慎治（慶応義塾大学電気工学科）

本論文では，濃淡画像の二値化および多値化における4次中心モーメントに基づくしきい値判別基準を用いた濃淡画像の多値化すべきクラス数の自動判別基準を提案し，多値化クラス数未知のときのしきい値決定法について述べる．最適クラス数推定の判別基準は次の二つの要素に基づいている．一つはしきい値別基準の各クラスの4次中心モーメントの和の減少傾向で，もう一つはその減少傾向の固有なバイアスである．二つの要素に関連するある評価関数を最小化することにより，濃淡画像の多値化すべき最適クラス数が求められる．最後に，提案した自動判別基準に基づき，クラス数の推定としきい値決定の実験を行い，結果を得ている．キーワード　2値化，多値化，ヒストグラム，4次中心モーメント，クラス数

オブジェクトベース符号化における物体操作のための背景推定法

数井君彦（株式会社富士通研究所）
森松映史（株式会社富士通研究所）
伊藤隆（株式会社富士通研究所）
松田喜一（株式会社富士通研究所）

動画像のオブジェクトベース符号化において表示時に手前にある物体を移動や削除を行う時に，処理後の画像が自然に見えるように，背景を推定する方式を提案する．動画像内の各物体を個々に符号化し，多重化して伝送するオブジェクトベース符号化は，新たなマルチメディアサービスを提供できる可能性が高いことから注目を集めている．このオブジェクトベース符号化の特徴の一つとして，画像を表示する際に，ユーザが各物体の属性情報（形状，時空間位置など）を用いて物体に対し消去，移動，変形などの操作を自由に行うことが可能になる，ということが挙げられる．物体に対して削除や移動といった操作を行う場合に，操作後の画像を自然に見せるには，操作物体の領域にある画素値を，それまで隠されていた背景のものに置きかえることが必要である．ところが，特に自然画像では物体に隠された背景情報は未知であるため，物体除去後の背景を推定する方式が必要になる．本稿で提案する背景推定方式では，オブジェクト符号化された各物体の形状情報，動き情報，および物体の奥行情報を利用している．また本方式は背景に複数の物体が存在する場合にも適用可能である，という利点を持つ．

ビデオ画像入力からの対話型3次元物体復元システム

鎌田洋（株式会社富士通研究所）

ビデオカメラにより捉えた物体の2次元画像に対して，3次元再構成技術を応用して，物体の形状と動きを3次元物体モデルとして計算機内に簡便に復元できるシステムを考案した．本システムの特長は，任意の環境において捉えた物体の2次元画像に対して，人間がポインティングデバイスにより特徴点を指示するだけで，システムが自動的に3次元物体モデルを復元できることである．本システムは，人間が指示した2次元画像上の特徴点の位置を2次元画像処理により自動補正した後，補正された特徴点位置に3次元再構成方式を適用することにより物体の3次元形状と動きを同時に復元し，復元した3次元形状に2次元入力画像のテクスチャを自動マッピングする．適用範囲を広くするため1台のビデオカメラで捉えた入力画像を用い， 3次元を想起させつつ手ぶれ誤差を吸収できる人間の負担が軽いインタフェースを考案した． 3次元再構成では，復元可否判定ができる独自の復元方式を応用するとともに，複数方向からの3次元物体復元の結果を統合することにより隠れの問題に対処した．

ブロック単位の予測切り換え方式を用いた多値画像の可逆符号化方式の検討

大沢秀史（キヤノン株式会社ＣＸプロジェクト）
加藤茂夫（宇都宮大学工学部情報工学科）
安田靖彦（早稲田大学理工学部電子・情報通信学科）

本論文では，静止画像に対する効率的な可逆圧縮符号化方式を提案する．提案する方式は，数種の予測モードを用意しておき，ブロック単位で効率の良い予測モードを用いる適応型の予測符号化法である．予測モードとしては，(1)7種の線形予測式から予測差分の最も小さくなる予測式を用いるモード， (2)着目画素が含まれるブロックの平均値を求め，これを予測値とするモード，(3)着目ブロックとのブロック差分が最も小さくなる参照ブロックを符号化済みの近傍領域から探索し，対応する位置の画素を予測値として予測符号化を行うモード，(4)さらに，振幅が異なっていても空間周波数分布の形状が類似しているものも参照ブロック選択の基準としてとりあげ，振幅補正後のブロックを参照ブロックとして予測するモード，の4通りを考えた．これらのうち最も予測差分が小さくなる予測モードを着目ブロックの予測モードとすることによって予測差分の低減を図る．一方，エントロピ符号化法としては，予測差分値が小さい場合は算術符号を用い，また，それが大きいときはハフマン符号を用いるハイブリッド方式を用いることとした．これによって，従来の可逆符号化方式より6-17パーセント高い圧縮率で符号化が可能になることがわかったので報告する．キーワード：可逆符号化，予測符号化，領域探索，算術符号化，ハフマン符号化，ブロック符号化

3次元対話空間AGORAへの画像圧縮の適用

千葉広隆（株式会社富士通研究所）
酒井憲一郎（株式会社富士通研究所）
野田嗣男（株式会社富士通研究所）

インターネット上で提供されるサービスは，文字や静止画像の二次元情報から立体を表示する三次元情報へとその表現技術が高度化している．三次元仮想都市は臨場感のある表現を行うため実際に複数の静止画像を撮影し，この静止画像を使って三次元空間を表現する．しかし，実写画像を用いた三次元仮想都市はデータ量が増加するため，インターネット（28.8 kbps，電話回線）を介して仮想都市に接続したユーザは，約70枚の実写画像を使った場面の表示に10分程度の待ち時間を必要としていた．この問題を解決するため，三次元仮想都市の実写画像をJPEG圧縮し，圧縮画像を効率よく復元して高速に表示する技術を開発した．画像復元時の復元テーブル生成を工夫することで復元時間を従来の約3分の2に高速化した復元ソフトウェア，および圧縮データの再表示時の遅延を防止するキャッシュ制御を開発し，三次元表示ソフトウェアに実装した．この結果，インターネット上での三次元仮想都市の場面当たりの表示を従来の6分の1に高速化した．実写画像を多数使ったリアルな電子商店街をインターネット上で利用する時に待ち時間を大幅に短縮でき，今後の応用が期待できる．

グローバル環境記述の参照によるマルチカメラシステムの視野制御

星野准一（セコムＩＳ研究所画像情報処理研究室）
増田功（セコムＩＳ研究所画像情報処理研究室）

マルチカメラによる多地点監視においては，撮影空間の全体像の把握を容易にしたり，カメラ操作の負担を軽減することが必要となる．本論文では，グローバルな環境記述を生成して参照することにより，撮影空間の全体像の把握を容易にするとともに，カメラ操作の負担を軽減する手法を提案する．グローバル環境記述とは，シーンの全体的な状況を階層的に記述した概略画像であり，背景画像，背景属性，被写体属性の三つのレイヤから構成される．グローバルな環境記述を内部表現として生成することにより，操作者に対して撮影環境の全体的な視野を生成するとともに，画面上のオブジェクトに対する直接的な操作を可能にする．また，環境記述を参照した動作ルールの適用により，注目したい対象を自動的にクローズアップしたり，カメラ間を連続的にトレースするなどの，仮想的な視野制御を能動的に行う．本論文では，グローバル環境記述の生成手法と，多地点監視に適用して動作確認を行った結果を示す．

リアル感の創造技術－ディジタル・リアリティ・クリエイション－

近藤哲二郎（ソニー株式会社）

ハイビジョンTVの普及に伴って，標準TV信号も変換して高画質で楽しみたいとの要求が強まってきた．標準TV信号の垂直ライン数と水平画素数をそれぞれ2倍に線形補間する4倍密画像が提案されていたが，高密度化に伴う画質向上はなくHD・TVモニタの性能を活かす事ができない．ハイビジョンTV信号の重要な特徴の一つにリアル感の再現があり，これを実現するために標準TV信号から高精細TV信号（リアル4倍密画像）への変換技術（ディジタル・リアリティ・クリエイション）を開発した．従来の補間技術と違って標準TV信号からハイビジョンTV信号への置き換え処理を基本としていて，高精細TV信号が本来持ち得るリアル感を創り出す事ができた．

X線画像の胃領域抽出法

小林富士男（福山大学工学部情報処理工学科）
富田将英（福山大学工学部情報処理工学科）
尾崎誠（福山大学工学部情報処理工学科）
坪井始（福山大学工学部情報処理工学科）
田中始男（福山大学工学部情報処理工学科）

一般に集団検診で撮影される胃のX線画像は，画質が良くない上に背景とのコントラストも十分でない．個人によって形状が異なり，時間的に変化する．更に，背景に骨や臓器が存在するため，正確に輪郭を抽出するのが困難である．本論文では，集団検診の際に撮影される立位正面充満像を対象に，異常の検出に有益な胃領域の輪郭を抽出するアルゴリズムを開発している．その方法は， 2値化処理によって胃の内部領域候補と境界候補を求める．次に，両候補を組合せて大まかな胃領域とする．この領域の凸閉包から元の領域を差し引き，凹部を求め削除領域とする．この削除領域に対しても，凸閉包から元の領域を差し引き凹部を求める．この凹部は元の領域の凸部になるので，追加領域とする．更に，大まかな胃領域の凸閉包から削除領域を差し引き，追加領域を加え微少な凹凸を除去して近似的胃領域とする．このようにして求めた近似的胃領域に対して，胃の内部が明るく撮影されていることを利用しながら，エッジを追跡して正確な胃領域を抽出している．また，実際の胃X線写真に適用し，その有効性を確認している．

画像電子学会誌 論文・資料アブストラクト第２６巻 第６号（１９９７年１２月）

松下温（慶応義塾大学理工学部） 重野寛（慶応義塾大学大学院理工学研究科）

Lajos Hanzo(Dept. of Electr. and Comp. Sc., Univ. of Southampton) Jurgen Streit(Dept. of Electr. and Comp. Sc., Univ. of Southampton)

渡辺靖彦（龍谷大学理工学部電子情報学科） 岡田至弘（龍谷大学理工学部電子情報学科） 金淵培（ＮＨＫ放送技術研究所先端制作技術研究部） 武田哲也（龍谷大学理工学部電子情報学科）

井門俊（東京工業大学精密工学研究所） 佐藤誠（東京工業大学精密工学研究所）

郭素梅（慶応義塾大学電気工学科） 小沢慎治（慶応義塾大学電気工学科）

数井君彦（株式会社富士通研究所） 森松映史（株式会社富士通研究所） 伊藤隆（株式会社富士通研究所） 松田喜一（株式会社富士通研究所）