HTMLのタグ解析をするには?

解決


Winux  2004-07-13 23:23:26  No: 84556  IP: [192.*.*.*]

はじめまして。

[ 環境:WindowsXP,VB6.0 EnterpriseEdition ]にて、Web上のHTMLのタグを
解析するプログラムを作成したいと考えています。
とりあえず "InterNet control" または "DHTML Edit control" などを
使用し、タグの構造をツリー表示するところから始めたいのですが、使い方が
いまいち良くわかりません。。。
例えば、HTMLテキストにどのようなタグが含まれているかを知るには、
どのような方法が考えられるでしょうか?
任意のタグだけを解析(Attribute等を知る)するにはどのようにしたら
良いのでしょうか?

どなたか、良いヒントをくださいませんか?
また、IEのコンポーネントについての詳しいリファレンスなどが置いてある
ページをご存知の方いらっしゃいましたら、教えてください。
(出来れば日本語ページがうれしいです…。)

どうぞよろしくお願いします。

編集 削除
VBひよっこ  2004-07-14 08:46:38  No: 84557  IP: [192.*.*.*]

Internet Transfer Control ならHTMLのソースを取得できますよ。

編集 削除
Winux  2004-07-14 10:41:43  No: 84558  IP: [192.*.*.*]

レスありがとうございます。

初めはInetでHTMLソースをバッファにためて、文字列でタグを拾っていました。

・・・がDHTML系のコンポーネントを参照すると、テキストではなくHTML自体をいじって
タグだけを参照したり、その属性などもダイレクトに必要な情報だけを持ってこれる
らしいことを耳にしたのですが・・・ですよね??(良く分かってないです)

というわけで、使ってみたいのですがMSDNライブラリ(online)で検索をかけた結果、
DHTMLのリファは見つけました。
プロパティやメソッド等が一覧になっているので、これらを
WebBrowser.Document.〜  の様に使用すればよいのですか??
リファレンスにはサンプルコードも載っていましたので、いろいろ試してみたいと思います。
もしIEコンポーネントをVBで扱う際のリファレンスサイト等、ご存知の方がいらっしゃいましたら
教えてください。

編集 削除
VBひよっこ  2004-07-14 15:01:05  No: 84559  IP: [192.*.*.*]

HNの通りVBは、超初心者ですが、過去レスで
http://www.microsoft.com/japan/msdn/columns/webteam/webteam03052001.asp#save
が参考にはならないでしょうか。
HTMLのソースでタグが"IMG"のものを探しだしています。

編集 削除
Winux  2004-07-14 16:40:56  No: 84560  IP: [192.*.*.*]

すみません! 私も過去ログからVBひよっこさんが教えて下さったページは
行ってみた後でした。。。

ちなみにおかげさまで、MSDNオンラインや過去ログから、タグを抜き出したり
それをツリー表示することは出来ました。(書き込み遅くなってすみません)

ただ過去ログにサンプルが出ていたり、プロパティ名が分かりやすいものは
なんとなく使えるのですが、DHTMLのリファにある機能をVB(WebBrowser等)から
扱う場合微妙に異なるところもあるようなので、その辺の詳しいリファレンスが
欲しいなぁというのが現在の状況です。

いろいろとアドバイスありがとうございました。
一応解決とさせていただきます。

編集 削除
Winux  2004-07-14 16:41:33  No: 84561  IP: [192.*.*.*]

押し忘れです。。。

編集 削除