XSLT 1.0 键比较多个键

Question

提前感谢您花时间阅读本文。

我有一个输入 xml 看起来像

<data>
<row>
    <Field1>ABC</Field1>
    <Field2>123</Field2>
    <tag3>BLAH</tag3>
    <tag4>BLAH1</tag4>
</row>
<row>
    <Field1>ABC</Field1>
    <Field2>789</Field2>
    <tag3>BLAH</tag3>
    <tag4>BLAH1</tag4>
</row>
<row>
    <Field1>DEF</Field1>
    <Field2>456</Field2>
    <tag3>BLAH3</tag3>
    <tag4>BLAH4</tag4>
</row>
<row>
    <Field1>456</Field1>
    <Field2>XYZ</Field2>
    <tag3>BLAH5</tag3>
    <tag4>BLAH6</tag4>
</row>

现在我有两个这样定义的键

<xsl:key name="Field1Key" match="data/row/Field1/text()" use="."/>
<xsl:key name="Field2Key" match="data/row/Field2/text()" use="."/>

我对键所做的是循环遍历 Field1 和 Field2 的唯一值

<xsl:for-each select="data/row/Field1/text()[generate-id() = generate-id(key('Field1Key',.)[1])]">
    <test>
        <xsl:value-of select="."/>      
    </test>
</xsl:for-each>

<xsl:for-each select="data/row/Field2/text()[generate-id() = generate-id(key('Field2Key',.)[1])]">
    <test>
        <xsl:value-of select="."/>      
    </test>
</xsl:for-each>

这给了我一个看起来像

的输出

<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>456</test>
<test>XYZ</test>

所以我的问题是，

如何避免 456 值出现两次？当我处理输入中的大量数据时，你能告诉我实现这一点的最有效方法吗？

非常感谢。

Answer 1

这样试试：

XSLT 1.0

<xsl:stylesheet version="1.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="utf-8" indent="yes"/>

<xsl:key name="Field1or2Key" match="Field1 | Field2" use="."/>

<xsl:template match="/data">
    <output>
        <xsl:for-each select="(row/Field1 | row/Field2)[generate-id() = generate-id(key('Field1or2Key', .)[1])]">
            <test>
                <xsl:value-of select="."/>      
            </test>
        </xsl:for-each>
    </output>
</xsl:template>

</xsl:stylesheet>

请注意，节点的顺序不同。如果这很重要，请使用 xsl:sort 获取所需的顺序。

已添加：

正如 Dimitre Novatchev 指出的那样，如果您有大量输入，排序可能不是您的最佳解决方案。我怀疑该顺序实际上不重要，所以我不会 post 替代解决方案（这必须更复杂）。

Answer 2

so my problem is,

How do I avoid the 456 value from appearing twice?

这是一种在不改变结果元素序列的预期顺序的情况下生成所需结果的简单方法：

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:key name="kF1" match="Field1" use="."/>
 <xsl:key name="kF2" match="Field2" use="."/>

 <xsl:template match="/*">
   <xsl:apply-templates select="row/Field1[generate-id() = generate-id(key('kF1',.)[1])]"/>
   <xsl:apply-templates select=
       "row/Field2[generate-id() = generate-id(key('kF2',.)[1])
      and
        not(key('kF1', .))]"/>
 </xsl:template>

  <xsl:template match="Field1 | Field2">
    <test><xsl:value-of select="."/></test>
  </xsl:template>
</xsl:stylesheet>

当此转换应用于提供的源 XML 文档时：

<data>
    <row>
        <Field1>ABC</Field1>
        <Field2>123</Field2>
        <tag3>BLAH</tag3>
        <tag4>BLAH1</tag4>
    </row>
    <row>
        <Field1>ABC</Field1>
        <Field2>789</Field2>
        <tag3>BLAH</tag3>
        <tag4>BLAH1</tag4>
    </row>
    <row>
        <Field1>DEF</Field1>
        <Field2>456</Field2>
        <tag3>BLAH3</tag3>
        <tag4>BLAH4</tag4>
    </row>
    <row>
        <Field1>456</Field1>
        <Field2>XYZ</Field2>
        <tag3>BLAH5</tag3>
        <tag4>BLAH6</tag4>
    </row>
</data>

产生了想要的、正确的结果:

<test>ABC</test>
<test>DEF</test>
<test>456</test>
<test>123</test>
<test>789</test>
<test>XYZ</test>

could you please point me to the most effecient way to achieve this as I'm dealing with a large amount of data in the input?

如果按照其他人的建议进行排序，则为 O(N*Log(N))，其中 N 是源 Field1 和 Field2 中元素的唯一字符串值的数量 XML 文件.

上面的解决方案没有做任何排序，额外的 not(key('kF1', .))] 只是 O(M)，其中 M 是 Field2 元素的唯一字符串值的数量来源 XML 文档。

因此，此解决方案 比使用排序重新建立原始顺序更有效——在 "large amount of data in the input" 的情况下更是如此。

XSLT 1.0 键比较多个键

XSLT 1.0 keys compare multiple keys

xml

xslt

xslt-1.0