はじめまして。
[ 環境:WindowsXP,VB6.0 EnterpriseEdition ]にて、Web上のHTMLのタグを
解析するプログラムを作成したいと考えています。
とりあえず "InterNet control" または "DHTML Edit control" などを
使用し、タグの構造をツリー表示するところから始めたいのですが、使い方が
いまいち良くわかりません。。。
例えば、HTMLテキストにどのようなタグが含まれているかを知るには、
どのような方法が考えられるでしょうか?
任意のタグだけを解析(Attribute等を知る)するにはどのようにしたら
良いのでしょうか?
どなたか、良いヒントをくださいませんか?
また、IEのコンポーネントについての詳しいリファレンスなどが置いてある
ページをご存知の方いらっしゃいましたら、教えてください。
(出来れば日本語ページがうれしいです…。)
どうぞよろしくお願いします。
Internet Transfer Control ならHTMLのソースを取得できますよ。
編集 削除レスありがとうございます。
初めはInetでHTMLソースをバッファにためて、文字列でタグを拾っていました。
・・・がDHTML系のコンポーネントを参照すると、テキストではなくHTML自体をいじって
タグだけを参照したり、その属性などもダイレクトに必要な情報だけを持ってこれる
らしいことを耳にしたのですが・・・ですよね??(良く分かってないです)
というわけで、使ってみたいのですがMSDNライブラリ(online)で検索をかけた結果、
DHTMLのリファは見つけました。
プロパティやメソッド等が一覧になっているので、これらを
WebBrowser.Document.〜 の様に使用すればよいのですか??
リファレンスにはサンプルコードも載っていましたので、いろいろ試してみたいと思います。
もしIEコンポーネントをVBで扱う際のリファレンスサイト等、ご存知の方がいらっしゃいましたら
教えてください。
HNの通りVBは、超初心者ですが、過去レスで
http://www.microsoft.com/japan/msdn/columns/webteam/webteam03052001.asp#save
が参考にはならないでしょうか。
HTMLのソースでタグが"IMG"のものを探しだしています。
すみません! 私も過去ログからVBひよっこさんが教えて下さったページは
行ってみた後でした。。。
ちなみにおかげさまで、MSDNオンラインや過去ログから、タグを抜き出したり
それをツリー表示することは出来ました。(書き込み遅くなってすみません)
ただ過去ログにサンプルが出ていたり、プロパティ名が分かりやすいものは
なんとなく使えるのですが、DHTMLのリファにある機能をVB(WebBrowser等)から
扱う場合微妙に異なるところもあるようなので、その辺の詳しいリファレンスが
欲しいなぁというのが現在の状況です。
いろいろとアドバイスありがとうございました。
一応解決とさせていただきます。
押し忘れです。。。
編集 削除