2012年3月20日火曜日

しおり(目次)のないPDFなんて読めるかっ!(前編)

ペーパーレス化を目指し、多くのドキュメントをPDF化してる。
いわゆる自炊ってやつもやってる。
書籍を裁断・スキャンしてPDFファイルにする行為だ。
ちなみに、誰が言い出したか知らないが、この「自炊」って呼び方はキライ。
他に呼び方がないのでつい使っちゃうけど。

そんな訳でPDFファイルを扱うことが多いのだが。
ちょっと量(ページ数)が多いものは「しおり」がないと読む気にならない。
※ ブックマークとか見出しとかいう場合もあるかも。

書籍をスキャンしたPDFには「目次」のページももちろんあるが、


それだけじゃダメで、PDF上のしおりがないと意味がない。


で、量が多いPDFといえばやはり書籍だ。
普段読む本は経済小説やビジネス書が多いが、これらは別にしおりとか不要。
基本的に頭から順に読むし、読み終わったら再度読み返すことがあまりないから。

問題は仕事で使う税務関係の専門書や、各種レポート等のPDFファイルなど。
これらは頭から読むものというよりは必要な時に必要な箇所をさっと参照するような使い方になる。

基本的に書籍をスキャンしてPDF化するときはOCRはかけない。
認識率を高くしようとすると手間がかかるし、とりあえずのOCRだけだとあまり使いものにならないので時間やマシンパワーの無駄遣いと感じるから。
「しおり」があれば、とにかく「しおり」さえあれば、目的のページには割とすぐに辿りつける。
なのでそれで充分かなと思うし、逆にこれがないと本当に読む気にならない。
スマートフォンでそういうPDFを見る場合でもしおりがなければ該当ページに辿りつくのは相当難しいが、しおりがあればなんとかなると思う。
まぁスマートフォンで見ることは滅多にないけど。


ということで、PDFのしおりを加工するソフトを探していて、ある時、某社の◯ウトライナーというソフトを購入してみた。
体験版もないしちょっと高い感じはしたが、代替も見つけられず仕方なく。
これがまた使えないというか、非常に残念なものだった。
ソフトそのものに問題があるというよりは、自分の期待が高すぎたのだろうが。
とにかくほとんど役に立たなかった。


で、あとで知ったのがJPdfBookmarksというソフト。

なんと!なんとですよ、奥さん!
オープンソースで無料で使える!

しかも!しかもですよ、奥さん!
WinだけじゃなくてMacでもLinuxでも使える!(CLIでも!)

さらに!さらにですよ、奥さん!
ア◯トライナーと比べてもはるかに簡単に使える!

どうですか!どうですか、奥さん!!


しおり(目次)の内容を予めテキストファイルに保存しておけば、これをJPdfBookmarksで一気に取り込める。
手順はこれだけ。
  1. jpdfbookmarksを起動
  2. 対象となる書籍PDFファイル(目次・内容を含む全ページのもの)を開く
  3. 「Tool」→「Load」からそのテキストファイルを選択して開く
  4. しおりが取り込まれるのでざっと確認して問題なければ上書き保存

たったこれだけでしおりを含んだPDFファイルが完成する。

では、そのテキストファイルはどのように準備するのか。
テキストファイルを読み込んでしおりにするだけならアウ◯ライナー含め他のソフトでも出来るものはあると思う。
が、JPdfBookmarksの方がそのテキストファイルに記載する形式が簡単で済むという感じか。
とはいえ、データを作るまでは多少面倒だし、説明も長くなるので後編で。


なお、専門書などは分厚いものが多く、目次(しおり)だけでも結構な量となる。
その中から目的のページを探すのも結構大変な時があるが、そんな時こそ検索。
ただ、本文はOCRをかけていないので、通常の検索をしても全くヒットしない。
で、PDFリーダーによっては検索機能に「しおりを含めて検索」というオプションがある。
純正のAcrobatReader(Acrobat)はそのオプションがあるし、私が常用しているPDF-XChange Viewerも大丈夫。
Nitro PDF Readerはなかったかな。(最新版は未確認)
そして残念なことに、MacのPreviewにはそのようなオプションがない・・・・。
Mac用のAcrobatReaderならもちろんOK。


そんな訳で、今日はこのへんで。



1 件のコメント:

  1. これは現在でもw10環境で動くのでしょうか。jpdfbookmarks内でJava Runtime Environmentを使用すると書いていますが。Java Runtime Environmentは検索してももはや見つかりません。

    返信削除