キャビネット･ユンゲ (00151)

From: Akitaka HOSOMI <hosomi@ga2.so-net.ne.jp>
Subject: Re: スタンプ印字された文字の読み取り方法( フーリエ変換法 - 検証篇 )
Date: 1998/08/21 01:33:56
Reference: junge/00150

さて、これまでのところで、

今回検証している FFT を使った文字特徴の抽出方法は、文字画像の明るさや文字のかすれに
対して、よく安定した特徴を取り出せることが、確認できたことと思う。

この利点を活用すると、先に見た文字の汚れについて、トリッキーな解決方法が考えられる。
これを確かめてみよう。



まず、CCD カメラの絞りを、明るさが飽和する付近まで、開けてやる。
( この状態は、画像をソフトウェアで加工しても、簡単に作り出せる )

すると、汚れの薄い部分が飽和して、背景と区別がつかなくなり、画像としては残らない。

このとき、文字自体も薄くなってしまうのだが、これに対しては、上述のように、殆ど、
心配する必要がない。



以下、汚れ画像、絞り開放画像、基準画像の順で、実際に見てみる。

※ スタンプインクの垂れている文字画像は、特徴の荒れが殆ど目立たないため、除外した。

※ 限界近くまで、文字を薄くしているので、ちょっと見づらいかもね。



 1. スタンプのあたりが強いため、文字が汚れた場合









 2. ダンボール箱が擦れて、文字が汚れた場合









 3. 作業中に、指などで擦って、文字が汚れた場合








以上のように、基準画像の特徴分布に、極めて近い文字特徴が得られる( ナイスだ ! )。





さて、話は少し跳ぶのだが、以前、スタンプ文字の二重印字の関連で、


＞このとき、得られる文字画像の特徴は、フーリエ変換の線型性から、概ね、
＞
＞     FFT( L + L ) = FFT( 2 × L ) = 2 × FFT( L )
＞
＞となる筈だ。今回の方法では、スペクトル強度で分布を正規化しているので、FFT( L ) が
＞ほぼ、そのまま得られる、と考えても良いだろう。


てなことを書いたが、実際の結果↓が、どうも気に食わないのだ、わたしにゃ。









# 新規に、こんな↑画像を使って試してもみたが、同じような結果だね。

どうやら、二重画像を、文字 L という基準画像の単なる和として捉えることには、問題が
ありそうだ。



この部分↑の再検討をしてみる。

二重印字の画像の別の捉え方としては、文字 L のゴースト画像( 信号が時間遅れを起こして
いるのだな )と見ることができる。これは、即ち、フィルタ処理された画像であるということ
を示しているのだから、単なる基準画像の和ではなく、フィルタの応答( つまり、畳込み和 )
と考えるべきである。


# これなら、予想の外れた結果の説明もつくだろうし .... たぶん、この捉え方が正解では
# ないのかな？


文字認識の邪魔になる不要な背景画像の除去についても、特徴空間上の引き算で何とかなる
だろうと、安直に考えていたのだが、上記の考え方に沿えば、そのような不要な背景画像を
撒き散らすフィルタをデフォルトで用いている画像、と捉えた方が良いように思う。


となると、畳込み和の分離を行うということで、特徴空間上で、例の対数をとって云々( ケ
プストラムという手法なんだけどね )を、試さにゃならんのよね。


# まぁ、" 文化の日 "のために、これは、キープしておくかな ....