HTMLの解析をするには?


なお  2004-07-12 23:14:07  No: 114724

JavaでHTMLを解析したいのですが、どのようなプログラムを作ればよいか教えていただけないでしょうか?できれば、HTMLを木構造で表示したいのですが?お願いします。


マグ  2004-07-13 01:21:48  No: 114725

VB.NETのDLLを自分でつくり、それをJavaに使というのはどうでしょうか?

ところで、木構造ってどのような意味なんでしょうか?


特攻隊長まるるう  2004-07-13 03:30:41  No: 114726

>ところで、木構造ってどのような意味なんでしょうか?
マグさんて独学なの?
基礎的な知識は本でも読んで鍛えないと強くならないですよ。
掲示板でちょっと聞いただけでは実力はつきません。
>木(ツリー)構造とは、一つの頂点からスタートして枝分かれを
>繰り返す、木(ツリー)のようなデータ構造のことです。
[参考]
http://www.stackasterisk.jp/tech/java/xml01_01.jsp
『ツリー構造とは』でググれば引っかかります。他に2分木
(バイナリツリー:binary tree)なんかも合わせて知って
おくといい基礎知識ですかねぇ…。

[VB.NET]なら System.Xml 名前空間なんてものがあるから
なんか構造的な取得も可能かも?[VB6.0]は知らないです。
ベタにタグごとに覚えながら検索するくらいしか思いつきま
せん。


GS  2004-07-13 09:37:49  No: 114727

解析とは具体的にHTMLの何を解析するのですか?


マグ  2004-07-13 18:04:02  No: 114728

特攻隊長まるるうさんの言うとおり独学です。
現在、学生で教えてくれる方が身近にいなくって(TT)


なお  2004-07-13 20:13:05  No: 114729

タグを木構造で解析して表示したいのですが?


マグ  2004-07-13 21:54:34  No: 114730

タグを木構造で解析して表示したいのですが?って
もしかして、
<html>
<table>
<tr><td>
</td></tr>
</table>
</html>

html
|
|-table
    |
    |-tr
       |
       |-td
という形にしたいってことですか?

そうならば、

indexOf関数を使って<〜〜〜>(タグ)を探させればいいではないでしょうか。
そして、終了させる所に</〜〜〜>を探させれば  おそらく、問題がないと思います。

そして、注意するところとしては、html言語の場合、
javaアプレットとjavascriptとスタイルシートとFlashとxmlとCSVがかかわってきてしまいます。
FlashとxmlとCSVとjavaアプレットはこのままでも大丈夫だと思います。

しかし、javascriptとスタイルシートには、外部からリンクで呼び出す形式には問題がないのですが・・・
HTML言語内にプログラムを記述して、動作させている仕組みに関しては
問題があります。
そこの部分を何とかすれば、できそうな気がすると思います。


※返信する前に利用規約をご確認ください。

※Google reCAPTCHA認証からCloudflare Turnstile認証へ変更しました。






  このエントリーをはてなブックマークに追加