pad_token_id 不适用于拥抱面变压器

pad_token_id not working in hugging face transformers

我想下载 GPT-2 模型和标记器。对于开放式生成,HuggingFace 将填充令牌 ID 设置为等于句末令牌 ID,因此我使用手动配置它:


import tensorflow as tf
from transformers import TFGPT2LMHeadModel, GPT2Tokenizer

tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = TFGPT2LMHeadModel.from_pretrained("gpt2", pad_token_id=tokenizer.eos_token_id)

但是,它给我以下错误:

TypeError: ('Keyword argument not understood:', 'pad_token_id')

我一直无法找到解决方案,也不明白为什么会出现此错误。将不胜感激。

你的代码不会为我抛出任何错误 - 我会尝试重新安装最新版本的 transformers - 如果这对你来说是一个可行的解决方案。