BERT模型可以使用JSON格式输入吗?
Is it possible to use JSON format input for BERT model?
我正在尝试创建一个从多个网络来源收集的知识库(单一事实来源)。 (例如维基 <-> 同人圈)
所以想试试Siamese网络或者计算与BERT嵌入文档的余弦相似度。
那么,我可以忽略那些 json 结构并训练它们吗?
虽然 BERT 没有经过专门训练来寻找 JSON 数据之间的相似性,但您始终可以提取 JSON 的值并将其连接成一个长句子,然后将其留给 BERT 来捕获如您所料的上下文。
或者,您可以为 JSON 之间的每个键值依赖项生成一个余弦相似度分数,并将它们聚合以生成 JSON 数据对的净相似度分数。
另请参阅 Sentence-BERT (SBERT),这是对预训练 BERT 网络的一种修改,它使用孪生网络和三重网络结构来导出语义上有意义的句子嵌入,可以使用余弦相似度进行比较。
我正在尝试创建一个从多个网络来源收集的知识库(单一事实来源)。 (例如维基 <-> 同人圈)
所以想试试Siamese网络或者计算与BERT嵌入文档的余弦相似度。
那么,我可以忽略那些 json 结构并训练它们吗?
虽然 BERT 没有经过专门训练来寻找 JSON 数据之间的相似性,但您始终可以提取 JSON 的值并将其连接成一个长句子,然后将其留给 BERT 来捕获如您所料的上下文。
或者,您可以为 JSON 之间的每个键值依赖项生成一个余弦相似度分数,并将它们聚合以生成 JSON 数据对的净相似度分数。
另请参阅 Sentence-BERT (SBERT),这是对预训练 BERT 网络的一种修改,它使用孪生网络和三重网络结构来导出语义上有意义的句子嵌入,可以使用余弦相似度进行比较。