2007年12月18日火曜日

PDFからフォントを抽出する

タイトル見てビックリしちまった!

http://d.hatena.ne.jp/project_the_tower2/20071217/1197900413より
1.方法1 PDFをPSに変換する
詳しくは参考資料1を参照

1.PDFをPSファイルに変換
2.PSファイルをテキストエディタで開いて、フォント部分の記述をコピーして独立したファイルにする。
3.取り出したフォントファイルをツールを使って他の形式に変換する。
この方法はPostScriptがテキストであることを応用した方法である。バイナリのPDFと違ってフォントの該当部分を容易に特定できる。

この方法の問題点としてはPDFからPSに変換する際に使うツールによってコードが大きく異なることである。その場合、コメント%%BeginResourceやcleartomarkは別の場所で現れるかまったく現れない。例えばAcrobatでPDFをPSに変換した場合、フォントを含んでいる部分にcleartomarkという命令は出てこない。(フォントを含んでいると思われるのはコードの最下層%ADOBeginSubsetFontからADOEndSubsetFontである。)

2.方法2 ツールを利用する
参考資料2で配布されている「PDF FontDecoder」を利用する。埋め込まれているフォントであれば問題なく抽出できる。

種類にType1と出た場合、拡張子をpfbにして保存する。もし他の形式にする必要があるならばこのファイルをfontforgeなどで読み込んで他の形式で保存する。

3.参考資料
PDFファイルからフォントを抜き出す ryoblog/ウェブリブログ
http://umb.at.webry.info/200702/article_1.html
papy's softwarelibrary
http://homepage3.nifty.com/e-papy/

0 件のコメント: