入力⇒2値化⇒傾き修正⇒文字認識⇒言語辞書による検証
◎入力
カメラやスキャナなどの光学機器で文書などを画像として取り込む。
◎2値化、傾き修正
2値化をすることによって、文字領域を取り出す。
また、一般に取り込まれた画像は機器の性質によって鮮明でなかったり、 傾きが生じていたり、ノイズを含んでいることが多いので濃度や傾きの調整、ノイズ除去などの前処理が必要となる。
◎文字認識
文字の高さなどを基準にして大きさの正規化をした後で、1文字ずつパターン辞書とマッチングを行う。 また、平滑化フィルタを用いてぼかすことによって、フォントの違いや位置ずれなどに対して強度を持つことが可能である。
◎文字の修正
言語辞書を用いることによって、文字の認識率を向上させることができる。
☆手書き文字の場合
手書き文字には、記述した人のくせなどによって同じ文字であっても違いが生じる。
よって、これに対応するために画像空間でのマッチングよりも2値画像としての形状や連結性を含んだ特徴空間でのマッチングが適している。
0 件のコメント
コメントを投稿