索引 PDFs/DOCs 后 Collection 中的 Solr No "Content" 字段
Solr No "Content" Field in Collection after Indexing PDFs/DOCs
我有一个 collection 数以千计的 documents/pdfs 并且有很多字段,例如:url、标题、日期...等等。但是没有内容字段,这似乎是必须存在的,以便您能够通过整个文档的关键字进行搜索,而不仅仅是标题。我看到有人说,通常情况下,内容字段是在您索引时自动生成的。
如何添加包含 PDFs/DOCs 中所有文本的内容字段?我在 Solr 6 上,所以我知道我需要使用 API 来创建一个新字段以使用 managed-schema。但是在那之后,我如何re-index我的collection?如果我只是将新字段命名为 "content",Solr 会知道 "content" 字段在重建索引时应该包含我的 PDFs/DOCs 中的所有文本吗?
创建 "content" 字段无效!相反,我为我的 _text_
字段设置了 stored=true 并且一切正常。
我有一个 collection 数以千计的 documents/pdfs 并且有很多字段,例如:url、标题、日期...等等。但是没有内容字段,这似乎是必须存在的,以便您能够通过整个文档的关键字进行搜索,而不仅仅是标题。我看到有人说,通常情况下,内容字段是在您索引时自动生成的。
如何添加包含 PDFs/DOCs 中所有文本的内容字段?我在 Solr 6 上,所以我知道我需要使用 API 来创建一个新字段以使用 managed-schema。但是在那之后,我如何re-index我的collection?如果我只是将新字段命名为 "content",Solr 会知道 "content" 字段在重建索引时应该包含我的 PDFs/DOCs 中的所有文本吗?
创建 "content" 字段无效!相反,我为我的 _text_
字段设置了 stored=true 并且一切正常。