HTMLの解析をするには?


なお  2004-07-12 14:14:07  No: 114724  IP: [192.*.*.*]

JavaでHTMLを解析したいのですが、どのようなプログラムを作ればよいか教えていただけないでしょうか?できれば、HTMLを木構造で表示したいのですが?お願いします。

編集 削除
マグ  2004-07-12 16:21:48  No: 114725  IP: [192.*.*.*]

VB.NETのDLLを自分でつくり、それをJavaに使というのはどうでしょうか?

ところで、木構造ってどのような意味なんでしょうか?

編集 削除
特攻隊長まるるう  2004-07-12 18:30:41  No: 114726  IP: [192.*.*.*]

>ところで、木構造ってどのような意味なんでしょうか?
マグさんて独学なの?
基礎的な知識は本でも読んで鍛えないと強くならないですよ。
掲示板でちょっと聞いただけでは実力はつきません。
>木(ツリー)構造とは、一つの頂点からスタートして枝分かれを
>繰り返す、木(ツリー)のようなデータ構造のことです。
[参考]
http://www.stackasterisk.jp/tech/java/xml01_01.jsp
『ツリー構造とは』でググれば引っかかります。他に2分木
(バイナリツリー:binary tree)なんかも合わせて知って
おくといい基礎知識ですかねぇ…。

[VB.NET]なら System.Xml 名前空間なんてものがあるから
なんか構造的な取得も可能かも?[VB6.0]は知らないです。
ベタにタグごとに覚えながら検索するくらいしか思いつきま
せん。

編集 削除
GS  2004-07-13 00:37:49  No: 114727  IP: [192.*.*.*]

解析とは具体的にHTMLの何を解析するのですか?

編集 削除
マグ  2004-07-13 09:04:02  No: 114728  IP: [192.*.*.*]

特攻隊長まるるうさんの言うとおり独学です。
現在、学生で教えてくれる方が身近にいなくって(TT)

編集 削除
なお  2004-07-13 11:13:05  No: 114729  IP: [192.*.*.*]

タグを木構造で解析して表示したいのですが?

編集 削除
マグ  2004-07-13 12:54:34  No: 114730  IP: [192.*.*.*]

タグを木構造で解析して表示したいのですが?って
もしかして、
<html>
<table>
<tr><td>
</td></tr>
</table>
</html>

html
|
|-table
    |
    |-tr
       |
       |-td
という形にしたいってことですか?

そうならば、

indexOf関数を使って<〜〜〜>(タグ)を探させればいいではないでしょうか。
そして、終了させる所に</〜〜〜>を探させれば  おそらく、問題がないと思います。

そして、注意するところとしては、html言語の場合、
javaアプレットとjavascriptとスタイルシートとFlashとxmlとCSVがかかわってきてしまいます。
FlashとxmlとCSVとjavaアプレットはこのままでも大丈夫だと思います。

しかし、javascriptとスタイルシートには、外部からリンクで呼び出す形式には問題がないのですが・・・
HTML言語内にプログラムを記述して、動作させている仕組みに関しては
問題があります。
そこの部分を何とかすれば、できそうな気がすると思います。

編集 削除