PDF文書内の文字列をVB側から検索するには?

解決


ちゃむ  2001-06-29 09:54:46  No: 74548  IP: [192.*.*.*]

ファイリングシステムみたいなものを作成中なのですが、CAD等作図されている文字とかは取れるですけど、PDFはどうもやり方が分かりません。いろいろ探したんですけど、VBとPDFについはなかなか見つかりませんでした。
こういったことは出来るんでしょうか?
また、PDF内の文字列(しおり等)をクリックしたときに、その文字列はVBで取得できるのでしょうか?

よろしくお願いします

編集 削除
PAPY  2001-06-29 12:02:46  No: 74549  IP: [192.*.*.*]

Portable Document Format(PDF)はLZW圧縮を使っているので触れない方が宜しいかと思います。

参考ページ
http://www.unisys.com/unisys/lzw/lzwfaq_j.html

編集 削除
ちゃむ  2001-06-29 15:09:41  No: 74550  IP: [192.*.*.*]

早速のご返答ありがとうございます。
書き込んでからも調べつづけると、「Acrobat 5.0 SDK」というのがあって、それならば、なんとか検索とかは出来そうなのです。英文のドキュメントで大変なことになりそうですが、がんばってみます。
LZW圧縮云々に関しては無知なので、また調べてみます。

ちなみに、PDF関連でとても良さげなページがありましたので報告しておきます。参考にしてみてください

参考ページ
http://plaza4.mbn.or.jp/~unit/pdf/index.html

編集 削除
たかみちえ  URL  2001-06-29 19:51:36  No: 74551  IP: [192.*.*.*]

たしか、わたしが何度か言っている、とほほのWWW入門にも、
LZW関連についての話がありましたね。
http://tohoho.wakusei.ne.jp/
アラカルトかどこかの、GIFの権利問題についてのあたりだったと思います。
  LZWはまあ、あまり触れないほうがいいかもしれませんねぇ…。
AcrobatReaderを起動させたりすれば、問題はなさそうですけど…。

  ところで、GIFをコントロールのブラウザで表示した場合、
(PDFならAcrobatReaderのコンポーネントを使った場合)
問題はないんでしょうかねぇ?
フリーのブラウザが出まわっているところを見ると、だいじょうぶなような気もしますけど、
それ以外のソフトに使うとなると、問題あるのかな…。やっぱり…。

編集 削除
PAPY  2001-06-30 12:52:31  No: 74552  IP: [192.*.*.*]

ちょっと古い情報ですがここに書いてあります。

http://www.forest.impress.co.jp/article/2000/03/16/lzw_license.html

編集 削除
たかみちえ  URL  2001-06-30 16:23:15  No: 74553  IP: [192.*.*.*]

一部英語だけで読めなかったところもありましたけど、
(エキサイトの翻訳を使っても、なんかへん…^^;)
まあ、とりあえずは、だいじょうぶなんでしょうか?
うーん、しんちょうに、今は検討中って言う答えばっかりでも、
どうしようもないですしぃ…。

編集 削除
PAPY  2001-07-01 10:01:58  No: 74554  IP: [192.*.*.*]

「触らぬ神に祟り無し」のこの一言につきます。(^^;

編集 削除
ちゃむ  2001-07-02 09:50:48  No: 74555  IP: [192.*.*.*]

[Acrobat 5.0 SDK]をインストールするとVBのサンプルがありました。
その中で、「Search pdf」というのがありました。これを参考にいろいろ模索してみようと思います。
仕事的に、「出来ませんね」と今の段階では答えられないので、なんとか可能性を追求していきます。
LZW関連に関しては、会社の方に報告して対処してもらうようにします。
たかみちえ さん  PAPY さん いろいろご教授ありがとうございました。
とりあえず、解決とします。

編集 削除
たかみちえ  URL  2001-07-06 21:56:16  No: 74556  IP: [192.*.*.*]

LZWですけど、
Susieプラグインで、LZW特許に抵触しないGIFを読むプラグインを見つけました。
同じ要領で(?)PDFもできるんじゃないでしょうかねぇ…?
えーっと、肝心の場所ですけど、
ベクターのSusiePluginのところを開いて、
ブラウザで"GIF"を検索すれば出てくる?

編集 削除
Say  2001-07-06 22:29:58  No: 74557  IP: [192.*.*.*]

たしか、PDFって、ポストスクリプト系のベクトルデータ
だったとおもうので、自前でやろうと思ったら、
解凍できてもそのあと構文解釈しないといけないような・・・
単に文字列取得したいのなら素直にSDK使ったほうが無難です。
ま、デコードアルゴリズムやトークン解析アルゴリズムの
研究の題材と考えれば、それはそれで楽しいのですが・・・

ちなみにその手の処理はVBは苦手で、C/C++のほうが
簡単にコーディングできます。

編集 削除