新規記事投稿
フォロー記事投稿
記事のキャンセル
From: Akitaka HOSOMI
<hosomi@ga2.so-net.ne.jp>
Subject: Re: スタンプ印字された文字の読み取り方法( 試案 )
Date: 1998/08/07 02:57:35
Reference: junge/00124
先のフーリエ変換法( 試案 )は、画像のような 2 次元データにそのまま適用しようと
すると、取り扱う特徴データの量が必然的に多くなるので、力ずくの計算を覚悟しなけ
ればならない。
2 次元データそのままではなく、一度、投影量などを求めてから、それをフーリエ変
換することも考えられるが、直交変換の前の段階で可逆性のない特徴量に変えてしまう
のも、センスが悪く、いま一つ面白味がない。
# 要するに、そういう取ってつけたような場当たり的で姑息な手法は、わたしの趣味
# ではないのだなぁ。
前に述べた問題点 1.の本質は、画像を、ピクセルの絶対位置に依存しない特徴量に、
変換できるか?、ということだ。
さらに、問題点 2.は、変換後の特徴空間上で、特徴量ノイズを簡単に除去できるか?
ということに、他ならない。
それでは、可逆性にこだわらずに、ちと、角度をかえて考えてみる。
------------------------------------------------------------------------
[ 自己相関法( 試案 ) ]
適当な近傍領域( 例えば 3 * 3 ピクセル程度だ )を定め、領域中心ピクセルの濃度
と近傍ピクセルの濃度との相関量を求め、これを中心ピクセルの特徴量とする。これ
は、自己相関特徴と呼ばれる。
画像内の各々のピクセルの相関係数を求め、0 〜 255 の範囲に適当な量子化を施す。
その後、量子化された値のヒストグラムを計算すると、これは、その画像が持ってい
るピクセル位置に不変な特徴量となる( このことは、自己相関の定義から明らかだ )。
つまり、この方法を用いても、問題点 1. はクリアできる。
さて、得られた画像特徴は、自己相関特徴のヒストグラムなので、予め、同様の方法
で、不要な背景図形の大雑把な特徴を与えてやれば、ヒストグラム上の引き算で、こ
の不要な特徴量を除去することができる。
そのため、問題点 2. についても、あまり心配ないように思える。
残りは、問題点 3.と 4.だ。今回の方法では、特徴抽出の時点で、これによる特徴の
荒れを回避することは難しい。
3. については、今のところ、適当なフィルタで加工した画像を使うようにして、こ
れの相関量を正規化し、特徴の荒れを抑えるぐらいしか方法がない。
# これについて、どの程度、効果が得られるかは、やってみないと判らない ....
4. については、入力された時点で、既に情報欠損を起こしている画像であり、なん
らかの方法で、この情報の補完なり、推定なり、を行なう必要がある。
( はっきり言えば、3.でも、そういうことなのだけれど )
以上のことから、得られた特徴量の推定を、特徴抽出に続く認識部でマジメに行なう
ことにする。
特徴抽出で得られた自己相関量のヒストグラム、これは、何らかの確率過程に基づい
た分布だ、考えられる。この分布が、どの基準文字の特徴分布なのか?、を推定する
ことが、文字を認識するということになる。
基準文字の特徴量についての分布は、予め知ることができるので、統計的指標を使っ
た推定が行なえる。
# これは、選挙結果の予測みたいなモンだね
ごくありふれたユークリッド距離などという単純な指標は用いず、最近では、常とう
手段になった観のある尤度推定( バリバリ、トレンドだぁ )などを行なうと、如何に
も、今風のスマートさんであり、たいへんカッコウがよろしい。
------------------------------------------------------------------------
♪ Moon Light Dance を歌ってる MAORI さんは、元宝塚なんだそうな ....
# なるへそ、これ↑にカップリングされてる曲は、思いっきりタカラヅカしておるぞよ。