専門書籍の自炊による電子書籍化(OCR含む)

専門書籍を自炊によって電子書籍化します。今回使用したのは、私の専門である労働方関係の書籍。2012年12月に出版された『労働法』第10版(菅野和夫著)です。


立派な専門書籍です。

厚さ約5センチあります。

中は文字ばかり。OCRで中身検索させたいものです。全体で1000ページ弱あります。

まずハードカバーをブリブリに破ってとってしまいます。この瞬間が若干寂しい(笑)。ハードカバーは残念ながらイメージスキャナでは取り込めません。

こんな感じになりました。本の厚さは約5㎝です。

PLUSの裁断機は裁断できるのはせいぜい1.5㎝です。このままでは裁断できません。

そんなわけで、カッターナイフで丁寧に4つに分けました。

いよいよ裁断の儀式です。あまり切りすぎないように気をつけます。

4回繰り返して完全にバラバラにしました。


これを少しずつイメージスキャナにかけます。私のは古いのですが、今だと、FUJITSU ScanSnap S1500 ですね。

最後にイメージスキャナに添付のAcrobatを使って書籍をOCR化して完成。量が多いので少し時間がかかりました(約30分)。Acrobatのバージョンによって少し画面イメージが異なるかも知れません。
OCR化が完成した電子書籍を文字検索しています。これで検索可能な便利な電子書籍ができあがりました。

 
iPadのGoodReaderを通してみるとこんな感じです。検索もしっかりできますし、これであの分厚い書籍を持ち歩く必要はありません。