新規記事投稿 フォロー記事投稿 記事のキャンセル
From: Akitaka HOSOMI <hosomi@ga2.so-net.ne.jp>
Subject: Re: スタンプ印字された文字の読み取り方法( 試案 )
Date: 1998/08/07 02:57:35
Reference: junge/00124

先のフーリエ変換法( 試案 )は、画像のような 2 次元データにそのまま適用しようと
すると、取り扱う特徴データの量が必然的に多くなるので、力ずくの計算を覚悟しなけ
ればならない。

 2 次元データそのままではなく、一度、投影量などを求めてから、それをフーリエ変
換することも考えられるが、直交変換の前の段階で可逆性のない特徴量に変えてしまう
のも、センスが悪く、いま一つ面白味がない。

# 要するに、そういう取ってつけたような場当たり的で姑息な手法は、わたしの趣味
# ではないのだなぁ。


前に述べた問題点 1.の本質は、画像を、ピクセルの絶対位置に依存しない特徴量に、
変換できるか?、ということだ。

さらに、問題点 2.は、変換後の特徴空間上で、特徴量ノイズを簡単に除去できるか?
ということに、他ならない。


それでは、可逆性にこだわらずに、ちと、角度をかえて考えてみる。


------------------------------------------------------------------------


[ 自己相関法( 試案 ) ]


適当な近傍領域( 例えば 3 * 3 ピクセル程度だ )を定め、領域中心ピクセルの濃度
と近傍ピクセルの濃度との相関量を求め、これを中心ピクセルの特徴量とする。これ
は、自己相関特徴と呼ばれる。

画像内の各々のピクセルの相関係数を求め、0 〜 255 の範囲に適当な量子化を施す。

その後、量子化された値のヒストグラムを計算すると、これは、その画像が持ってい
るピクセル位置に不変な特徴量となる( このことは、自己相関の定義から明らかだ )。

つまり、この方法を用いても、問題点 1. はクリアできる。



さて、得られた画像特徴は、自己相関特徴のヒストグラムなので、予め、同様の方法
で、不要な背景図形の大雑把な特徴を与えてやれば、ヒストグラム上の引き算で、こ
の不要な特徴量を除去することができる。

そのため、問題点 2. についても、あまり心配ないように思える。



残りは、問題点 3.と 4.だ。今回の方法では、特徴抽出の時点で、これによる特徴の
荒れを回避することは難しい。


 3. については、今のところ、適当なフィルタで加工した画像を使うようにして、こ
れの相関量を正規化し、特徴の荒れを抑えるぐらいしか方法がない。

# これについて、どの程度、効果が得られるかは、やってみないと判らない ....


 4. については、入力された時点で、既に情報欠損を起こしている画像であり、なん
らかの方法で、この情報の補完なり、推定なり、を行なう必要がある。
( はっきり言えば、3.でも、そういうことなのだけれど )


以上のことから、得られた特徴量の推定を、特徴抽出に続く認識部でマジメに行なう
ことにする。



特徴抽出で得られた自己相関量のヒストグラム、これは、何らかの確率過程に基づい
た分布だ、考えられる。この分布が、どの基準文字の特徴分布なのか?、を推定する
ことが、文字を認識するということになる。

基準文字の特徴量についての分布は、予め知ることができるので、統計的指標を使っ
た推定が行なえる。

# これは、選挙結果の予測みたいなモンだね


ごくありふれたユークリッド距離などという単純な指標は用いず、最近では、常とう
手段になった観のある尤度推定( バリバリ、トレンドだぁ )などを行なうと、如何に
も、今風のスマートさんであり、たいへんカッコウがよろしい。


------------------------------------------------------------------------

     ♪ Moon Light Dance を歌ってる MAORI さんは、元宝塚なんだそうな .... 

# なるへそ、これ↑にカップリングされてる曲は、思いっきりタカラヅカしておるぞよ。