ホーム > カテゴリ > Java・Android >

JavaでURLのHTMLを取得する

Javaの使い方(目次)

URLのHTMLソースを取得する

import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;

public class Main {

    public static void main(final String[] args){
        URL url = null;
        InputStreamReader isr = null;

        try {
            url = new URL("https://www.petitmonte.com/");

            // InputStream(バイトストリーム)のままでもHTMLは取得できるが文字化けする
            InputStream is = url.openStream();

            // InputStreamをUTF8のInputStreamReader(文字ストリーム)に変換する
            isr = new InputStreamReader(is,"UTF-8");
            
            // 一文字毎に読み込む
            while(true) {
                int i = isr.read();
                if (i == -1) {
                    break;
                }
                System.out.print((char)i);
            }
        }catch (Exception e) {
            System.out.println(e.getMessage());
        }finally {
            try {
                isr.close();
            }catch (Exception e) {
                System.out.println(e.getMessage());
            }
        }

    }
}

結果

HTMLのソースが出力される





関連記事



公開日:2018年05月08日
記事NO:02648