如何在张量中表示这些类型的值?

How to represent those types of values in a tensor?

我有这样的数据集:

(0, 1), UpDownUpUp            
(2, 3), UpUpUpDownDownDown   
(0, 2), DownUp               
(0, Undefined), DownUp   

如何在 PyTorch 张量中表示这种类型的数据?那么我可以用它来训练神经网络吗?

这是一种方法:

  • 您保持原样,将未定义的替换为 9(我们将使用 9 表示[不执行任何操作])
  • 您将标签编码为整数 5、6
  • 将变量转换为列表
  • 对于每批,取最长序列的长度
  • 用 9 填充输入和标签以匹配您在上一步中找到的长度

生成的数据集类似于以下输入和目标对:

[0, 1, 9, 9, 9, 9], [5, 6, 5, 5, 9, 9]
[2 ,3, 9, 9, 9, 9], [5, 5, 5, 6, 6, 6]
[0, 2, 9, 9, 9, 9], [6, 5, 9, 9, 9, 9]
[0, 9, 9, 9, 9, 9], [6, 5, 9, 9, 9, 9]