数年ぶりにスキャナを購入してみました。それで、印刷された文章を取り込んで、付属の文字認識ソフトで読み取ってみました。すると、かなりの認識率です。

やはり、ハイフン「-」と「ー」を間違えたり、「(」と前の文字が合わさって「八」になったりと、細かい読み取りミスはありますが、それでも、かなりイケてます。

今回読み取りで必要なのは、(..)の中の数字だったので、プレビューして間違っているところだけ訂正して、あとは、なでしこ正規表現コマンドで、だだっと数行のプログラムを2つ作って、あっという間に作業完了しました。

5枚程度の文章から、必要な部分だけを取り出すのに、かなり時間短縮が実現できました。ただ、安いスキャナを買ったので、スキャン時間が長いのが欠点です。

コメント †
お名前:
 


作成:2008-09-07 09:41:45/更新:2008-09-07 09:48:53

→テキスト形式で見る

くじらぶろぐD by kujirahand RSS

konawiki 0.23