删除与 CSS 选择器匹配的标签(非内容)的简单方法?
Simple way to remove tags (not content) matching a CSS selector?
是否有一种简单的方法来处理 HTML 文件,以便可以删除与某个 CSS 选择器匹配的标签?我的动机是 pandoc
生成 HTML 在我看来过于冗长的输出,用 <span class="math inline"> ... </span>
包围任何数学表达式,而通常 ...
就足够了。对于显示数学,输入和输出往往有换行符,因此专用工具可能比 grep
或类似工具更好。目标是减少带宽使用,因此客户端的任何内容都会被淘汰。
Pandoc 插入这些 span 标签以使 javascript 库(如 mathjax)能够正确显示数学...您当然可以使用您选择的 html 处理工具删除它们,例如Nokogiri 如果你正在使用 ruby,请在 removespans.rb
:
中添加类似的内容
require 'nokogiri'
doc = Nokogiri::HTML(File.open("file.html"))
doc.search('span').remove
puts doc
然后执行:
pandoc -s -o file.html input.md
ruby removespans.rb > output.html
是否有一种简单的方法来处理 HTML 文件,以便可以删除与某个 CSS 选择器匹配的标签?我的动机是 pandoc
生成 HTML 在我看来过于冗长的输出,用 <span class="math inline"> ... </span>
包围任何数学表达式,而通常 ...
就足够了。对于显示数学,输入和输出往往有换行符,因此专用工具可能比 grep
或类似工具更好。目标是减少带宽使用,因此客户端的任何内容都会被淘汰。
Pandoc 插入这些 span 标签以使 javascript 库(如 mathjax)能够正确显示数学...您当然可以使用您选择的 html 处理工具删除它们,例如Nokogiri 如果你正在使用 ruby,请在 removespans.rb
:
require 'nokogiri'
doc = Nokogiri::HTML(File.open("file.html"))
doc.search('span').remove
puts doc
然后执行:
pandoc -s -o file.html input.md
ruby removespans.rb > output.html