记事本++如何删除不在“”内的所有内容

Notepad++ How do I remove everything not inside " "

我有一个包含数千行这样的数据文件

<li data-value="2-30 Media - Rock that Brain">
  <span>2-30 Media - Rock that Brain</span>
</li>
<li data-value="2-30 Media - RockThatBrain">
  <span>2-30 Media - RockThatBrain</span>
</li>
<li data-value="2-30 Media - Test Box Quizz">
  <span>2-30 Media - Test Box Quizz</span>
</li>

我需要这样的数据。

2-30 Media - Rock that Brain
2-30 Media - RockThatBrain
2-30 Media - Test Box Quizz

任何帮助将不胜感激。

正则表达式就是你想用的!按 Ctrl + H 在 Notepad++ 中打开“替换”对话框。

假设你想要在每一行上显示的文本是 <span> 标签的内容,请执行以下操作:

查找:.*?<span>(.*?)<\/span><\/li>

替换:\n

然后只需全部替换即可。

因此正则表达式将捕获 <span> 标签内的内容,然后用捕获组和换行符替换整个 <li>

希望对您有所帮助!如果您还有类似的事情要做,Regex101 是设计正则表达式的好工具。

使用 'Regular Expression' 搜索和替换选项。

搜索这个:.*?\"(?<name>.*?)\"

并替换为:\r\n