Azure 搜索,跳过大 blob 但仍然索引元数据
Azure Search, skip large blobs but still index metadata
我们有一组 blob,各种内容。
我们需要为元数据和内容编制索引,但我们很乐意跳过不受支持的文件类型和超大文件的内容。例如我们有
File One.docx
- 支持的类型 - 索引元数据和内容(良好)
File Two.dat
- 不支持的类型 - 索引元数据跳过内容(好)
File Three.txt
- 支持的类型,由于 blob 的大小而失败。 (不好)
我们的搜索是基于 docs 的配置,我们只是将 failOnUnsupportedContentType
添加到 Configuration
并将其设置为 false
我们想为 File Three.txt
的元数据编制索引,但跳过大内容,例如 failOnOversizedContent
,我们将其设置为 false
。
现在我们收到一个关于 blob 大小过大的错误。
2018 年 1 月 3 日更新
我意识到我原来使用 AzureSearch_SkipContent
blob 元数据的建议并没有解决问题,因为仍然需要下载 blob 来处理内容类型元数据。
为了让这个场景正常工作,我们正在添加 indexStorageMetadataOnlyForOversizedDocuments
索引器配置设置。它采用布尔值,默认情况下为 false
,因此在索引器配置中将其设置为 true
以启用它。这是刚出炉的,将于 1 月 19 日在全球范围内投入生产。
原回复
您可以将 AzureSearch_SkipContent: true
元数据添加到大 blob,如 Controlling which parts of the blob are indexed 中所述。我知道这可能会带来不便,但这可以让您畅通无阻。
We would like to index the metadata for File Three.txt but skip the
large content, something like failOnOversizedContent
which we would
set to false.
这看起来像是一个有用的功能请求 - 请在 our UserVoice site 添加建议,我们会考虑这一点,尤其是当我们看到其他客户提出此要求时。
我们有一组 blob,各种内容。
我们需要为元数据和内容编制索引,但我们很乐意跳过不受支持的文件类型和超大文件的内容。例如我们有
File One.docx
- 支持的类型 - 索引元数据和内容(良好)
File Two.dat
- 不支持的类型 - 索引元数据跳过内容(好)
File Three.txt
- 支持的类型,由于 blob 的大小而失败。 (不好)
我们的搜索是基于 docs 的配置,我们只是将 failOnUnsupportedContentType
添加到 Configuration
并将其设置为 false
我们想为 File Three.txt
的元数据编制索引,但跳过大内容,例如 failOnOversizedContent
,我们将其设置为 false
。
现在我们收到一个关于 blob 大小过大的错误。
2018 年 1 月 3 日更新
我意识到我原来使用 AzureSearch_SkipContent
blob 元数据的建议并没有解决问题,因为仍然需要下载 blob 来处理内容类型元数据。
为了让这个场景正常工作,我们正在添加 indexStorageMetadataOnlyForOversizedDocuments
索引器配置设置。它采用布尔值,默认情况下为 false
,因此在索引器配置中将其设置为 true
以启用它。这是刚出炉的,将于 1 月 19 日在全球范围内投入生产。
原回复
您可以将 AzureSearch_SkipContent: true
元数据添加到大 blob,如 Controlling which parts of the blob are indexed 中所述。我知道这可能会带来不便,但这可以让您畅通无阻。
We would like to index the metadata for File Three.txt but skip the large content, something like
failOnOversizedContent
which we would set to false.
这看起来像是一个有用的功能请求 - 请在 our UserVoice site 添加建议,我们会考虑这一点,尤其是当我们看到其他客户提出此要求时。