任何人都可以解释如何在评分中计算 scoreSum

Question

我看到 scoreSum 在 qry:score 的公式中用于 relevance score computation。

scoreSum是如何计算的？

谁能解释一下 scoreSum 是什么以及它是如何计算的？

<qry:score 
  formula="(256*scoreSum/weightSum)+(256*qualityWeight*documentQuality)" 
  computation="(256*12/1)+(256*1*0)">3072</qry:score>

Answer 1

scoreSum 是您查询的所有词项分数的总和。请参阅以下简单示例：

xquery version "1.0-ml";

let $doc := <test>dog cat fish</test>

return xdmp:document-insert("test.xml", $doc);

for $i in cts:search(doc(), cts:word-query("dog cat fish"), "relevance-trace")
return cts:relevance-info($i)

结果如下：

<qry:relevance-info xmlns:qry="http://marklogic.com/cts/query">
  <qry:score formula="(256*scoreSum/weightSum)+(256*qualityWeight*documentQuality)" computation="(256*360/2)+(256*1*0)">46080</qry:score>
  <qry:confidence formula="sqrt(score/(256*8*maxlogtf*maxidf))" computation="sqrt(46080/(256*8*18*log(29)))">0.6092764</qry:confidence>
  <qry:fitness formula="sqrt(score/(256*8*maxlogtf*avgidf))" computation="sqrt(46080/(256*8*18*(5.3483/2)))">0.6836947</qry:fitness>
  <qry:uri>test.xml</qry:uri>
  <qry:path>fn:doc("test.xml")</qry:path>
  <qry:and>
    <qry:score formula="scoreSum" computation="136+224+0">360</qry:score>
    <qry:term weight="2.125">
      <qry:score formula="8*weight*logtf" computation="17*8">136</qry:score>
      <qry:key>13246596259210807488</qry:key>
      <qry:annotation>pair(word("dog"),word("cat"))</qry:annotation>
    </qry:term>
    <qry:term weight="3.5">
      <qry:score formula="8*weight*logtf" computation="28*8">224</qry:score>
      <qry:key>3660582207022472029</qry:key>
      <qry:annotation>pair(word("cat"),word("fish"))</qry:annotation>
    </qry:term>
    <qry:word>...</qry:word>
</qry:and>

如您所见，scoreSum 是术语分数 (136) pair(word("dog"),word("cat")) 和 pair(word("cat"),word("fish"))(224) 的总和 (136+224+0)。

输出在您的环境中可能会有所不同，具体取决于数据库中的索引设置和文档。此输出位于一个空的数据库中，并启用了 fast phrase searches（这就是为什么有成对项）。如果只给出一个 word-query，则在输出中省略 scoreSum 计算，并且 scoreSum == score of your term.

任何人都可以解释如何在评分中计算 scoreSum

Can anyone explain how scoreSum is calculated in scoring

marklogic