導航:首頁 > 凈水問答 > jsoup過濾標簽

jsoup過濾標簽

發布時間:2023-05-16 02:49:10

① 用JSOUP解析HTML,怎樣刪除掉其中的一段DIV標簽及內容

用JSOUP解析HTML刪除掉其中的一段DIV標簽及內容的方法:
1、解析並提取 HTML 元素回
如下:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8", "url");
Element content = doc.getElementById("content");
Elements divs= content.getElementsByTag("div");
for (Element div: divs) {
String linkHref = link.attr("id");
String linkText = link.text();
}

2、用答remove方法刪除div

div.remove();

② jsoup 過濾指定標簽問題JAVA

for(Elementlink:links){
//通過link.child(index)或link.getElementsBy<attr>(key,value)獲得部分子節點
mArrayList.add(link.text());
}

③ jsoup如何獲取不在標簽內的文本

先取到body片段,然後過濾掉div標簽和內容,取到的內容就是中國。

④ jsoup得到的結果帶標簽,球打什麼賜教怎麼去掉這些標簽

String str1 = str.text();

⑤ 用JSOUP解析HTML,怎樣刪除掉其中的一段DIV標簽及內容

用JSOUP解析HTML刪除掉其中的一段DIV標簽及內容的方法是根據id刪除。
使用核心方法如下:

doc.getElementById("detail_question").remove()

舉例如下:
從baseHtml這斷代碼中刪除指定id的標簽:
String baseHtml = "<div id='stylized' class='myform'>"
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>"
+ "<div id='detail_question'>Rock</div></div>";

Document doc = Jsoup.parse(baseHtml);
doc.getElementById("detail_question").remove();
Elements elements = doc.select("div");
System.out.println(elements);
輸出的結果中沒有detail_question這個div節點了:
<div id='stylized' class='myform'>
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>

⑥ 利用Jsoup獲取具體標簽屬性值

doc.select("meta[name=description]"),get(0).attr("content")

大致是這么寫的,你可以研究一下JSOUP的選擇器,

chenying99/archive/2013/01/04/2844615,html" target="_blank">http://www.cnblogs.com/chenying99/archive/2013/01/04/2844615.html

⑦ 如何不讓jsoup.parse過濾標簽

//過濾內容中的非法標簽
org.jsoup.nodes.Document document = Jsoup.parse(html);
//只過濾body內容
org.jsoup.nodes.Document body = Jsoup.parse(document.body().html());
//自定義的標簽白名單
Cleaner cleaner = new Cleaner(WhitelistFactory.createWhitelist(WhitelistFactory.EPUB20));
org.jsoup.nodes.Document bodyCleaned = cleaner.clean(body);
document.body().html(bodyCleaned.html());
String newHtml = document.html();

⑧ java 利用jsoup 如何去除一段代碼中的所有html標簽,只留純文本

document.text();

閱讀全文

與jsoup過濾標簽相關的資料

熱點內容
煤礦污水處理廠安全管理制度 瀏覽:280
什麼樹脂與PET結合牢度非常好 瀏覽:321
環保餐館油煙凈化器多少錢 瀏覽:157
便攜空氣凈化器怎麼樣 瀏覽:819
鍋爐排污的水為什麼稱有機廢水 瀏覽:857
4s店用的濾芯多少錢 瀏覽:449
什麼原因會導致超濾膜斷絲 瀏覽:116
世保康反滲透凈水器怎麼樣 瀏覽:594
本實訓在稱量純水時為什麼只要求 瀏覽:221
樹脂工藝品能用水性漆嗎 瀏覽:649
污水處理廠在線規范 瀏覽:697
生物污水池怎麼清理 瀏覽:474
飛利浦空氣凈化器換了濾網怎麼辦 瀏覽:377
生活污水處理廠噸水投資 瀏覽:215
兩相帶切割高揚程污水泵多少錢 瀏覽:815
反滲透膜除氯效果 瀏覽:64
焦化污水處理oao工藝流程 瀏覽:968
冰不過濾會怎樣 瀏覽:778
石家莊污水提升器 瀏覽:536
倍仕和美國艾肯凈水器哪個好 瀏覽:428