生活記録

日々のこと(旧はてなの茶碗)

OCR補足

ちよつと言葉が足らなかつたので幾つか補足。

舊字や舊假名だから六惜いと云ふよりも、昔の活字で組まれた本は上手く行かないことがあると云ひたかつたのです。版面の印刷状態、字形に癖がある活字、ルビや圏點、さらには四分空きで組まれてゐること抔、單に字劃の複雑さだけでは片付けられない要因があります。此処で取り上げた寶文館の本はOCRで上手く文字が拾へなかつたので、相当苦労しました。

逆に、普通にベタで組まれた癖のない版面の本(ルビや圏點がなければ尚よし)だつたら、舊字や舊假名でも造作もなく變換してくれました。例へば木下杢太郎(岩波書店)のときは、少し漢字の手直しをしただけで済んだのでとても樂でした。

タイピングはのろいしキーボードも碌なのを使つてゐないので、一ページ以上のものだつたら、怠け者の私は入力よりOCRの方を選擇しますね。

何より新字・現代仮名遣の口語文ではなく、山田孝雄のやうな舊字舊假名の文語文を大量に入力する場合でしたら、何はともあれOCR以外でやろうとは考へませんでした。IMEや辞書ではなかなかカヴァーできないこともありますし。