如何在 java 中制作文本过滤器?
How to make a text filter in java?
我正在尝试为互联网页面制作过滤器。它应该下载一个页面,然后在代码中查找图像。我已经有了下载部分,并且 html 代码进入了字符串。但我不知道如何过滤这段代码。我想程序应该删除除了 "img id="image"src="https:/....jpg"" 这样的部分之外的所有内容,然后删除除 link 之外的所有内容。所以,最后它应该只是一个带有 links 到图像的字符串。有什么方法可以像这样过滤代码吗?
Jsoup 似乎是一个相关的图书馆。它甚至会为您下载文档。
由于您已经将页面加载到字符串中,您可以执行以下操作:
Document doc = Jsoup.parse(html);
Elements images = doc.getElementsByTagName("img");
您可以通过调用 attr
函数从单个 Element
获取属性:
Element image = images.get(0);
String href = image.attr("href");
我正在尝试为互联网页面制作过滤器。它应该下载一个页面,然后在代码中查找图像。我已经有了下载部分,并且 html 代码进入了字符串。但我不知道如何过滤这段代码。我想程序应该删除除了 "img id="image"src="https:/....jpg"" 这样的部分之外的所有内容,然后删除除 link 之外的所有内容。所以,最后它应该只是一个带有 links 到图像的字符串。有什么方法可以像这样过滤代码吗?
Jsoup 似乎是一个相关的图书馆。它甚至会为您下载文档。
由于您已经将页面加载到字符串中,您可以执行以下操作:
Document doc = Jsoup.parse(html);
Elements images = doc.getElementsByTagName("img");
您可以通过调用 attr
函数从单个 Element
获取属性:
Element image = images.get(0);
String href = image.attr("href");