用于任意文本预测的 AI 模型?

AI model for arbitrary text prediction?

不确定这是不是正确的地方,朋友告诉我去这里。我想制作一个在训练期间接收文本的 AI,然后根据用户 "samples" 给出新文本(这是 而不是 用于聊天程序)。

例如,如果我输入以下内容进行训练:

abc123,test,example
def456,work,coolio

和以下抽样:

ghi789,what

它应该输出一些基于它所知道的东西,而不是它所知道的东西的精确复制品(当然除非输入用于训练)。

这可能吗?有没有现成的模型?我在考虑 char-rnn 但它不允许在采样期间自定义输入。

抱歉,如果这是错误的地方或本网站不允许这样做。我进行了广泛的研究,但找不到任何东西。我知道一点点 TensorFlow,但不足以从头开始。

提前致谢!

字符循环神经网络将是一个很好的起点。如果您是该领域的新手,那绝对是最好的起点,因为有很多教程和示例可以帮助您起步,而且我们知道它们很管用。

阅读 Karpathy 关于此的优秀博客和论文:http://karpathy.github.io/2015/05/21/rnn-effectiveness/

您当然可以在采样期间提供自定义输入。网络训练完成后,您可以通过多种不同方式进行采样,事实上,您必须至少提供第一个字符 "custom input".

典型的采样模式是随机 select 第一个字符作为第一个 RNN 序列步骤的输入。然后 RNN 将在字母表上产生一个概率分布,您可以从中随机抽取下一个字符。

对于第 2 个字符,假设您从 RNN 的概率分布中采样,然后随机 selected 字符成为下一个 RNN 序列步骤的输入。以此类推。

请注意,没有什么可以阻止您对多个字符序列进行播种,忽略每一步的 RNN 输出,然后在某些输入序列完成后对 RNN 输出进行采样。从而实现您从自定义输入序列开始然后继续的目标。我希望这种方法对你很有效。