从 ADLS Gen2(blob 文件)和 CosmosDB(自定义元数据)在 Azure 认知搜索中创建单个索引
Creating a single index in Azure Cognitive Search from ADLS Gen2 (blob files) and CosmosDB (custom metadata)
我在 Azure Data Lake Storage Gen2 中使用 Azure 认知搜索来索引 blob (pdf/xlsx/pptx/docx/videos/images)。我还有一个面向商业用户的应用程序,允许他们使用创建的索引搜索所有文档。
现在我需要允许业务用户为任何检索到的文档创建可自定义的标签(即:用户想要使用名为 project_name[=22= 的标签来标记文档] 并将其值设置为 project-lotus)。这些标签将从我们的应用程序创建,并将存储在 Cosmos DB 集合中。
- 有没有一种简单的方法可以将这些标签作为新字段添加到我已经在我的应用程序中使用的同一 blob 索引中?
理想情况下,我希望有一个从 2 个来源构建的索引:blob 文件 (ADLS Gen2) 和与每个文件相关的自定义元数据 (Cosmos DB)。
Field mappings 可用于此!
当我们需要使用来自多个数据源的数据填充索引字段时,它们非常有用 - 在我的例子中,ADLS Gen2(blob 文件)和 Cosmos DB(文件元数据)。
有关详细信息,请查看本教程:index from multiple data sources using the .NET SDK
Optimize indexing with push API or as suggested index from multiple Azure data sources 使用 .NET SDK 在这里会很有用,因为它们支持索引来自 Azure cosmos DB 的数据并合并存储在 Azure Blob 存储中的数据。
我在 Azure Data Lake Storage Gen2 中使用 Azure 认知搜索来索引 blob (pdf/xlsx/pptx/docx/videos/images)。我还有一个面向商业用户的应用程序,允许他们使用创建的索引搜索所有文档。
现在我需要允许业务用户为任何检索到的文档创建可自定义的标签(即:用户想要使用名为 project_name[=22= 的标签来标记文档] 并将其值设置为 project-lotus)。这些标签将从我们的应用程序创建,并将存储在 Cosmos DB 集合中。
- 有没有一种简单的方法可以将这些标签作为新字段添加到我已经在我的应用程序中使用的同一 blob 索引中?
理想情况下,我希望有一个从 2 个来源构建的索引:blob 文件 (ADLS Gen2) 和与每个文件相关的自定义元数据 (Cosmos DB)。
Field mappings 可用于此!
当我们需要使用来自多个数据源的数据填充索引字段时,它们非常有用 - 在我的例子中,ADLS Gen2(blob 文件)和 Cosmos DB(文件元数据)。
有关详细信息,请查看本教程:index from multiple data sources using the .NET SDK
Optimize indexing with push API or as suggested index from multiple Azure data sources 使用 .NET SDK 在这里会很有用,因为它们支持索引来自 Azure cosmos DB 的数据并合并存储在 Azure Blob 存储中的数据。