如何使用Tensorflow构建Seq2seq模型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何使用Tensorflow构建Seq2seq模型相关的知识,希望对你有一定的参考价值。

参考技术A 切字分词
使用结巴分词。
移除低频词
代码中,用vocabulary_size 限制词表的大小。用UNK代替不包括在词表中的单词。例如,单词“非线性”不在词表中,则句子“非线性在神经网络中是重要的”变成“UNK在神经网络中是重要的”。
准备开始和结束标签以及填充标签
在decoder端,GO表示解码开始,用EOS表示解码结束,同时用PAD表示填充。模型使用bucketing处理不同长度的句子。如果输入是3个tocken的英语句子,相应的输出是6个tocken的法语句子,则它们将被放入到[5,10]的bucket中。编码器将输入的长度将填充到5,解码器输入的长度将填充到10 ,填充标签是PAD。

以上是关于如何使用Tensorflow构建Seq2seq模型的主要内容,如果未能解决你的问题,请参考以下文章

使用 seq2seq API(ver 1.1 及更高版本)的 Tensorflow 序列到序列模型

使用Tensorflow搭建一个简单的Seq2Seq翻译模型

TensorFlow 中 RNN 和 Seq2Seq 模型的 API 参考

seq2seq 模型的预处理

学习笔记CB014:TensorFlow seq2seq模型步步进阶

Tensorflow seq2seq 模型,损失值不错,但预测错误