Вопрос по java – получить все HTML в виде строки из HTMLDocument

6

Я кодирую в Java ..

Кто-нибудь знает, как я могу получить содержимое javax.swing.text.html.HTMLDocument в виде строки? Это то, что я до сих пор получил ...

URL url = new URL( "http://www.test.com" );

HTMLEditorKit kit = new HTMLEditorKit(); 
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument(); 
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream()); 
kit.read(HTMLReader, doc, 0); 

Мне нужно содержимое HTMLDocument в виде строки.

Пример:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">    <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">

....... так далее.

Любая помощь будет оценена. Мне нужно использовать класс HTMLDocument для правильной обработки HTML :)

Спасибо Даниэль

Ваш Ответ

2   ответа
15
StringWriter writer = new StringWriter();
kit.write(writer, doc, 0, doc.getLength());
String s = writer.toString();
Спасибо! Код Joop Eggens сделал свое дело! Zelleriation
1

Error: User Rate Limit ExceededIOUtils.toString(inputStream)

Error: User Rate Limit Exceeded

Content content = document.getContent();
String str = content.getString(0, content.length() - 1);
Error: User Rate Limit ExceededgetContentError: User Rate Limit Exceeded

Похожие вопросы