キャビネット･ユンゲ (00154)

From: Akitaka HOSOMI <hosomi@ga2.so-net.ne.jp>
Subject: Re: スタンプ印字された文字の読み取り方法( フーリエ変換法 - これで時間切れだぁ～ )
Date: 1998/08/23 05:05:03
Reference: junge/00152

この↓パワースペクトルについて、もう少し考えてみませう。






すでに気がついているかも知れないが、今回の手法では 128 ピクセル分の周期で、
パワースペクトルが得られるため、文字画像の周波数成分を知りたければ、律儀に
 1 ピクセルごとの濃度( 明るさ )を FFT に与えてやる必要はない。

つまり、128 ピクセル単位の水平方向、垂直方向の濃度であれば良いわけで、FFT 
の入力として、文字画像の濃度投影量が使えるわけだ( これについては、自己相関
特徴のところで、ちょこっと書いてる )。

実際、これまでの文字画像について試したところでも、1 ピクセル単位の場合と、
 128 ピクセル単位の場合とで、どちらも全く同じスペクトルが得られている。

# 同じだから、図は載せないよ～～ん


ピクセル濃度と違って、濃度投影量を入力とする場合には、 FFT 自体の計算量は
 1 / 128 に抑えられる。計算の負荷が軽いうえに、結果が同じであるため、応用
時には、この方法を用いると良いだろう。

# 理論に走るか、応用に走るか、ってなところだなぁ ... わしは気に入らんけど。



 MMX Pentium 200 MHz( 512 KB L2-キャッシュ )での実際の処理時間は、

   ピクセル毎の濃度を入力した場合、324 msec

   濃度投影量を入力とした場合、    1.3 msec

といったところで、濃度投影量を使う方が、圧倒的に速く計算できる。


※ 双方とも、画像特徴抽出( 濃度 ) + 入力正規化 + FFT + 出力正規化の処理
   時間だが、濃度投影量の方が、データが少ない分、一連の処理でキャッシュが
   有効に働くようだ。




文字の読み取りに必要な特徴量の計算が、とくにヤヤコシイ画像処理も必要とせず、
 1.3 msec などという速度でまわってしまう。

そのため、基準文字専用、欠け文字専用、汚れ文字専用、といった、それぞれに異
なる性格を持つ文字判定部を、一つのプログラムの中に実装することも可能だろう。

合議制で文字判断を行うような、イカす ! ソフトウェアを書ける時代は、既に来て
いる。



# こういうのが、まじめなプログラマの夢ってやつじゃないのかね？などと、風流を
# 満喫していると、必ず、現実に引き戻されたりもするのだなぁ。夏休みは終わって
# しまった .....