从 tf.data.Dataset 获取元组元素

Get elements of tuple from tf.data.Dataset

我正在构建一个神经网络,其中有两个输入节点,每个节点都连接到一个嵌入层。

我创建了一个 tf.data.Dataset,其中包含一个元组作为模型的输入。

如何拆分元组中的张量以将第一个张量(标量)转发到嵌入层 1 并将第二个张量(数组)转发到自定义前向传递中的嵌入层 2?

我在下面提供了一个示例。

提前致谢。

import pandas as pd
import tensorflow as tf

from random import randrange

df = pd.DataFrame(columns=['cust', 'items'])

for i in range(100):

    cust = randrange(100)
    items = [randrange(100), randrange(100), randrange(100), randrange(100), randrange(100)]

    df = df.append({"cust": cust, "items": items}, ignore_index=True)

    i += 1

dataset = tf.data.Dataset.from_tensor_slices((df["cust"], df["items"]))

dataset_batches = dataset.batch(10)

# custom forward pass
def call(self, inputs):
    x = inputs[0]  # This does not work.
    y = inputs[1]  # This does not work.

    x = self.cust(x)  # input layer 1
    y = self.items(y)  # input layer 2

    x = self.emb_cust(x)  # embedding layer 1
    y = self.emb_items(y)  # embedding layer 2

    z = self.pre_calc([x, y])  # lambda layer

    return z

对于有类似问题的人:

我上面的方案其实是正确的,所以你可以从当前批次中提取元组的元素,并把它作为一个列表提出来用于正向传递。

def run_model(self, epochs, dataset_batches):

    for epoch in range(epochs):
            
            for step, (cust, items) in enumerate(dataset_batches):
            
                   # execute forward pass
                   y_pred = self([cust, items], training=True)
                   ...