提取所有 TD 或 TH 列

extract all TD or TH columns

目前我使用以下方法提取 table 行中的所有列:

my_element_collection = row.select("td"))

但是在我处理的一些文档中,一些列是使用 th 而不是 td 创建的。有没有办法使用 jsoup 的 selector 来 select 所有 "th" "td" 元素? (如果这是一个正则表达式,我想它会像 th|td 但我正在努力在文档中找到答案...)

使用

my_element_collection = row.select("td,th")

这是实时示例:http://try.jsoup.org/~31-SUI1dXuWbSFK8ZPhQ5eqozTI