Doc2Vec论文及实战

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Doc2Vec论文及实战相关的知识,希望对你有一定的参考价值。

参考技术A 最近读了一遍Doc2Vec原文,整篇文章思路清晰明了,建议在读博客之前先看一遍文章,因为文章中将各个部分讲的很详细。

这里只记录文章中最最重要的一段话:

At prediction time, one needs to perform an inference step to compute the paragraph vector for a new paragraph. This

is also obtained by gradient descent. In this step, the parameters for the rest of the model, the word vectors W and the softmax weights, are fixed.

即带优化的推断,所有同一个训练好的模型每次得到的文档向量可能是不同的~

doc2vec的输入是TaggedDocument向量,它包括word_list和tags两部分,word_list是文档的分词列表,如['火箭','是','总冠军',]。tags是文档的标签列表。

   创建TaggedDocument对象:

模型参数说明:

1.dm=1 PV-DM  dm=0 PV-DBOW。

2.size 所得向量的维度。

3.window 上下文词语离当前词语的最大距离。

4.alpha 初始学习率,在训练中会下降到min_alpha。

5.min_count 词频小于min_count的词会被忽略。

6.max_vocab_size 最大词汇表size,每一百万词会需要1GB的内存,默认没有限制。

7.sample 下采样比例。

8.iter 在整个语料上的迭代次数(epochs),推荐10到20。

9.hs=1 hierarchical softmax ,hs=0(default) negative sampling。

10.dm_mean=0(default) 上下文向量取综合,dm_mean=1 上下文向量取均值。

11.dbow_words:1训练词向量,0只训练doc向量。

定义模型:

   训练模型:

保存模型:

使用infer_vector来推理文档的向量 (输入text仍然是文档的分词列表):

使用model.docvecs[tag]得到已训练文档的向量。

得到与输入文档相似度最高的十个文档:

参考:

https://arxiv.org/pdf/1405.4053.pdf

https://blog.csdn.net/weixin_39837402/article/details/80254868

https://radimrehurek.com/gensim/models/doc2vec.html

基于SSM+SpringBoot《校园二手交易平台项目》实战开发教程(附论文及源码)-毕业设计

文章目录

1.项目简介

毕业设计基于SSM+SpringBoot校园二手交易平台项目

源码在课程附件中进行下载,地址:https://download.csdn.net/course/detail/36195

在如今的大学校园中,伴随着学生的购买能力的提高和每年的升学和毕业,存在许多各种类型的二手商品。目前,二手商品交易成为了当代大学生课余生活的一大热门。以我校为例,每年都要举办的“跳蚤”市场,可见大学生对二手商品交易的需求,然而这种方式有很多局限性和偶然性,远远无法满足广大学子交易的需求。

建立一个校园二手交易平台可以大大方便在校的学生,方便了同学也营造了节约光荣,浪费可耻的校园文化氛围。最主要的是,它也可以通过网络将自己不用的东西放在网上,也可在网上找到自己需要的东西,物美价廉,达到双赢。

2.技术选型

  • 前端:HTML、CSS、JS、Jquery、Thymeleaf、BootStrap
  • 后端:SpringMvc、Spring、MyBatis、MyBatisPlus、SprringBoot、Redis
  • 数据库: MySql 8.x
  • 项目构建构建: Maven 3.6
  • 开发环境: IDEA 2019.3 + Windows 10
  • 部署环境: Linux

3.项目资料

4.项目部分截图

商城前台:

商城后台:




源码在课程附件中进行下载,地址:https://download.csdn.net/course/detail/36195

以上是关于Doc2Vec论文及实战的主要内容,如果未能解决你的问题,请参考以下文章

论文|Doc2vec的算法原理代码实现及应用启发

论文|万物皆可Vector之Word2vec:2个模型2个优化及实战使用

论文|万物皆可Vector之Word2vec:2个模型2个优化及实战使用

基于SSM+SpringBoot《校园二手交易平台项目》实战开发教程(附论文及源码)-毕业设计

基于SSM+SpringBoot《校园二手交易平台项目》实战开发教程(附论文及源码)-毕业设计

学术版R论文写作!网络模型拟合实战1