数年ぶりにスキャナを購入してみました。それで、印刷された文章を取り込んで、付属の文字認識ソフトで読み取ってみました。すると、かなりの認識率です。
やはり、ハイフン「-」と「ー」を間違えたり、「(」と前の文字が合わさって「八」になったりと、細かい読み取りミスはありますが、それでも、かなりイケてます。
今回読み取りで必要なのは、(..)の中の数字だったので、プレビューして間違っているところだけ訂正して、あとは、なでしこ正規表現コマンドで、だだっと数行のプログラムを2つ作って、あっという間に作業完了しました。
5枚程度の文章から、必要な部分だけを取り出すのに、かなり時間短縮が実現できました。ただ、安いスキャナを買ったので、スキャン時間が長いのが欠点です。