如何从 xml 个文件中仅提取特定部分并合并它们?
How to extract only specific part from xml files and merge them?
我有很多 xml 个文件,我想将它们合并到一个文件中。我不想从根目录合并它们,而是从 child 之一合并它们。
如何使用 grep/sed/awk 语句进行处理?
XML 1:
<root>
<version>AB</version>
<Data>
<Title>MyTitle</Title>
<SubTitle>Mysub</SubTitle>
</Data>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<root>
XML 2:
<root>
<version>AB</version>
<Data>
<Title>MyTitle 2</Title>
<SubTitle>Mysub 2</SubTitle>
</Data>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
<root>
我想要以下 XML 文件:
<root>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
</root>
对于像您的示例一样简单的文件,您可以使用简短的 sed
命令打印第一行、从 <file
到 </file>
的所有行以及最后一行行:
sed -n '1p;/<file/,/<\/file>/p;$p' XML1 XML2
请don't parse XML with regex, but use a proper parser like xidel改为:
$ xidel -se '
element root {
doc("1.xml")//file,
doc("2.xml")//file
}
' --output-node-format=xml --output-node-indent
<root>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
</root>
我有很多 xml 个文件,我想将它们合并到一个文件中。我不想从根目录合并它们,而是从 child 之一合并它们。 如何使用 grep/sed/awk 语句进行处理?
XML 1:
<root>
<version>AB</version>
<Data>
<Title>MyTitle</Title>
<SubTitle>Mysub</SubTitle>
</Data>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<root>
XML 2:
<root>
<version>AB</version>
<Data>
<Title>MyTitle 2</Title>
<SubTitle>Mysub 2</SubTitle>
</Data>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
<root>
我想要以下 XML 文件:
<root>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
</root>
对于像您的示例一样简单的文件,您可以使用简短的 sed
命令打印第一行、从 <file
到 </file>
的所有行以及最后一行行:
sed -n '1p;/<file/,/<\/file>/p;$p' XML1 XML2
请don't parse XML with regex, but use a proper parser like xidel改为:
$ xidel -se '
element root {
doc("1.xml")//file,
doc("2.xml")//file
}
' --output-node-format=xml --output-node-indent
<root>
<file author="JXJX" name="MyFile1">
<desc>File1</desc>
<field>Random Field</field>
</file>
<file author="HIGH" name="MyFile2">
<desc>File2</desc>
<field>Random Field</field>
</file>
</root>