SYSTEM DEVELOPMENT

STUDY GROUP

PDF変換について

最近業務でPDFファイルの画像変換が必要になったためGoogleで検索したところApachePDFBoxというライブラリがあることが分かりました。業務として必要な機能としてはPDFファイルを各ページへ分解、PDFとして保存しその各ページをさらに画像(png)として保存する機能が必要になったのでApachePDFBoxを採用てみました。(日本語化対応もされています)実際に業務利用した感想としてはPDFの各ページのPDF化とそのページの画像化ができましたが、ページによってはPDF化する際の時間が大幅に違う点がある事がわかりました。(画像化の方は解像度が指定できるので速度はある程度解像度を低くすれば速くなりそう)処理が速いファイルは20ページくらいでも数秒でPDF化が終わり、遅いファイルは1ページに1分程度掛かる状況です。当然各ページの構成や内容量にもよるとは思いますが速度という点で改善していってくれればかなり強力なライブラリだと感じました。漢字圏はどうしても2バイトで文字を扱うのでそのあたりの変換速度はある程度仕方がないかなとは思っています。

menu