导航:首页 > 净水问答 > jsoup过滤标签

jsoup过滤标签

发布时间:2023-05-16 02:49:10

① 用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容

用JSOUP解析HTML删除掉其中的一段DIV标签及内容的方法:
1、解析并提取 HTML 元素回
如下:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8", "url");
Element content = doc.getElementById("content");
Elements divs= content.getElementsByTag("div");
for (Element div: divs) {
String linkHref = link.attr("id");
String linkText = link.text();
}

2、用答remove方法删除div

div.remove();

② jsoup 过滤指定标签问题JAVA

for(Elementlink:links){
//通过link.child(index)或link.getElementsBy<attr>(key,value)获得部分子节点
mArrayList.add(link.text());
}

③ jsoup如何获取不在标签内的文本

先取到body片段,然后过滤掉div标签和内容,取到的内容就是中国。

④ jsoup得到的结果带标签,球打什么赐教怎么去掉这些标签

String str1 = str.text();

⑤ 用JSOUP解析HTML,怎样删除掉其中的一段DIV标签及内容

用JSOUP解析HTML删除掉其中的一段DIV标签及内容的方法是根据id删除。
使用核心方法如下:

doc.getElementById("detail_question").remove()

举例如下:
从baseHtml这断代码中删除指定id的标签:
String baseHtml = "<div id='stylized' class='myform'>"
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>"
+ "<div id='detail_question'>Rock</div></div>";

Document doc = Jsoup.parse(baseHtml);
doc.getElementById("detail_question").remove();
Elements elements = doc.select("div");
System.out.println(elements);
输出的结果中没有detail_question这个div节点了:
<div id='stylized' class='myform'>
+ "<input id='txt_question' name='preg' type='text' disabled='disabled' style='width:150px;'>

⑥ 利用Jsoup获取具体标签属性值

doc.select("meta[name=description]"),get(0).attr("content")

大致是这么写的,你可以研究一下JSOUP的选择器,

chenying99/archive/2013/01/04/2844615,html" target="_blank">http://www.cnblogs.com/chenying99/archive/2013/01/04/2844615.html

⑦ 如何不让jsoup.parse过滤标签

//过滤内容中的非法标签
org.jsoup.nodes.Document document = Jsoup.parse(html);
//只过滤body内容
org.jsoup.nodes.Document body = Jsoup.parse(document.body().html());
//自定义的标签白名单
Cleaner cleaner = new Cleaner(WhitelistFactory.createWhitelist(WhitelistFactory.EPUB20));
org.jsoup.nodes.Document bodyCleaned = cleaner.clean(body);
document.body().html(bodyCleaned.html());
String newHtml = document.html();

⑧ java 利用jsoup 如何去除一段代码中的所有html标签,只留纯文本

document.text();

阅读全文

与jsoup过滤标签相关的资料

热点内容
山西哪里有做树脂瓦的 浏览:626
油罐废水 浏览:603
反渗透的设备怎么调 浏览:622
污水井盖板有什么作用 浏览:420
树脂画怎么把胶平铺 浏览:464
市政污水不设化粪池 浏览:634
edi费是什么费用 浏览:299
油管路过滤器安装 浏览:117
飞利浦空气除湿净化器怎么清洗 浏览:642
智能电子水处理器多少钱 浏览:632
奇骏的空调滤芯什么牌子的好 浏览:137
蒸馏水可以净化海水 浏览:250
城市居民用水产生多少污水 浏览:843
济南小型医院污水处理设备 浏览:388
短程分之蒸馏 浏览:546
耐高温树脂固化剂 浏览:692
常见电镀废水处理问题 浏览:179
污水管道的j代表什么 浏览:251
蒸馏用蒸汽压缩机价格 浏览:992
小米空气净化器怎么添加 浏览:782