非常规使用Tensorflow Inception模型
Unconventional use of Tensorflow Inception model
通常 Tensorflow 的初始模型用于包含实际图像的实际图像数据,但是,我打算以非常规的方式使用它,并且想知道,1) 这是否可能 2) 结果是否可能如此糟糕以至于最好找到不同的方法。
我基本上有一组文本数据,我已将其转换为数字格式,例如:
[-0.123123, 0.164564, ...]
。
这种转换使得相似的文本数据在各自的形式中具有相似的数字表示形式。实际数字表示已处理文档中每个词的词向量。然后将此数据保存为 .jpg 文件。我计划创建两个数据 类、'Similar' 和 'non-similar',其中 similar 包含已预先确定为相似的两个文档的串联,而 non-similar 包含两个文档的串联已被预先确定为不相似的。
希望当这个模型已经根据这些数据进行训练时,我可以输入一个图像数据,它是两个文档数字矩阵形式的组合,如上所示,尽管不是传统意义上的实际图像,模型将能够以一定的精度输出 'Similar' 或 'Non-similar',具体取决于构成输入网络的基本图像的两个文件。 Tensorflow 的 inception 会接受这样的输入吗?
初始网络经过训练可以识别广泛的模式并对照片进行非常准确的分类,就像人眼一样。如果您可以用眼睛分辨文档之间的差异或相似之处,那么 Inception 很有可能会做同样的事情:)
虽然 inception 的卷积层被训练到 ImageNet task,但大部分的魔法都发生在最后的全连接层,其中数据通过 softmax 分类器输入,然后输出类别和概率.
有一个叫做 transfer learning 的东西可以将这些最终层重新训练到您选择的类别。这避免了必须重新训练 30 多个卷积层(非常耗时),同时利用初始网络的模式识别能力。试一试,看看结果如何!
通常 Tensorflow 的初始模型用于包含实际图像的实际图像数据,但是,我打算以非常规的方式使用它,并且想知道,1) 这是否可能 2) 结果是否可能如此糟糕以至于最好找到不同的方法。
我基本上有一组文本数据,我已将其转换为数字格式,例如:
[-0.123123, 0.164564, ...]
。
这种转换使得相似的文本数据在各自的形式中具有相似的数字表示形式。实际数字表示已处理文档中每个词的词向量。然后将此数据保存为 .jpg 文件。我计划创建两个数据 类、'Similar' 和 'non-similar',其中 similar 包含已预先确定为相似的两个文档的串联,而 non-similar 包含两个文档的串联已被预先确定为不相似的。
希望当这个模型已经根据这些数据进行训练时,我可以输入一个图像数据,它是两个文档数字矩阵形式的组合,如上所示,尽管不是传统意义上的实际图像,模型将能够以一定的精度输出 'Similar' 或 'Non-similar',具体取决于构成输入网络的基本图像的两个文件。 Tensorflow 的 inception 会接受这样的输入吗?
初始网络经过训练可以识别广泛的模式并对照片进行非常准确的分类,就像人眼一样。如果您可以用眼睛分辨文档之间的差异或相似之处,那么 Inception 很有可能会做同样的事情:)
虽然 inception 的卷积层被训练到 ImageNet task,但大部分的魔法都发生在最后的全连接层,其中数据通过 softmax 分类器输入,然后输出类别和概率.
有一个叫做 transfer learning 的东西可以将这些最终层重新训练到您选择的类别。这避免了必须重新训练 30 多个卷积层(非常耗时),同时利用初始网络的模式识别能力。试一试,看看结果如何!