小于 html table 中的实际数据
Less than actual data in html table
我在做
Element tbody = doc.select("td#tab table tbody").first();
System.out.println(tbody.childNodeSize());
在以下 url.
但只返回 5 tr 个元素
后来我试着看看 jsoup 返回了什么,它只显示了 5 个 tr 元素。
System.out.println(tbody.html());
Javascript
document.querySelector('td#tab table tbody').childNodes.length
显示 623 条记录。
Jsoup 解析器有问题还是我出错了?
谢谢。
文档以大量编码数据开头。我认为 Jsoup 在 1M 之后截断大小。如果你想获取整个文档,你可以这样配置:
String url = "http://164.100.181.140/fcs/Helpline/NFSA/ReportRegidWise.aspx?val=NSMxODcjUiMwMDEzNzMjMDM3OTg0IzEwMDEwMDMwMDAxMiNCUEwjMDkxODcwMDk0NjE4NDI5MQ%3d%3d";
Document doc = Jsoup.connect(url)
.timeout(10000)
.maxBodySize(0) //setting to 0 turns size checking off
.get();
Element tbodyEl = doc.select("td#tab table tbody").first();
System.out.println(tbodyEl);
这需要更长的时间,但您可以获得所有信息。
我在做
Element tbody = doc.select("td#tab table tbody").first();
System.out.println(tbody.childNodeSize());
在以下 url.
但只返回 5 tr 个元素
后来我试着看看 jsoup 返回了什么,它只显示了 5 个 tr 元素。
System.out.println(tbody.html());
Javascript
document.querySelector('td#tab table tbody').childNodes.length
显示 623 条记录。
Jsoup 解析器有问题还是我出错了?
谢谢。
文档以大量编码数据开头。我认为 Jsoup 在 1M 之后截断大小。如果你想获取整个文档,你可以这样配置:
String url = "http://164.100.181.140/fcs/Helpline/NFSA/ReportRegidWise.aspx?val=NSMxODcjUiMwMDEzNzMjMDM3OTg0IzEwMDEwMDMwMDAxMiNCUEwjMDkxODcwMDk0NjE4NDI5MQ%3d%3d";
Document doc = Jsoup.connect(url)
.timeout(10000)
.maxBodySize(0) //setting to 0 turns size checking off
.get();
Element tbodyEl = doc.select("td#tab table tbody").first();
System.out.println(tbodyEl);
这需要更长的时间,但您可以获得所有信息。