英文文本分类实战之一——实战项目总览

Posted 征途黯然.

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了英文文本分类实战之一——实战项目总览相关的知识,希望对你有一定的参考价值。

[1] 总览

  【英文文本分类实战】系列共六篇文章:

  【英文文本分类实战】之一——实战项目总览
  【英文文本分类实战】之二——数据集挑选与划分
  【英文文本分类实战】之三——数据清洗
  【英文文本分类实战】之四——词典提取与词向量提取
  【英文文本分类实战】之五——数据加载
  【英文文本分类实战】之六——模型与训练-评估-测试


  目前来看,如果方向是文本分类的话,英文文本分类、中文文本分类都需要掌握。

  很多数据集都是英文的,比如多标签文本数据集、层次结构标签文本数据集,想在方向上更进一步的话,必须得学会处理英文文本。

  同时,平时遇到的项目很多会涉及中文文本,学会中文文本分类也是必须的。


  本实战项目代码具有强拓展性,易于拓展到其他数据集、其他模型。

[2] 代码获取地址

  >=点击此处下载=<

  代码结构如图所示:本项目使用pytorch实现。

[3] 实战前需要掌握的知识

  1、了解pytorch基本操作;

  2、掌握嵌入层预训练词向量的概念;

  3、掌握神经网络模型相关的基本概念;

[4] 相关参考

  [1] https://blog.csdn.net/pnnngchg/article/details/85054243
  [2] https://blog.csdn.net/pnnngchg/article/details/89404449
  [3] https://github.com/649453932/Chinese-Text-Classification-Pytorch#chinese-text-classification-pytorch

以上是关于英文文本分类实战之一——实战项目总览的主要内容,如果未能解决你的问题,请参考以下文章

BERT-多标签文本分类实战之一——实战项目总览

BERT-多标签文本分类实战之一——实战项目总览

BERT-多标签文本分类实战之六——数据加载与模型代码

BERT-多标签文本分类实战之六——数据加载与模型代码

BERT-多标签文本分类实战之六——数据加载与模型代码

英文文本分类实战之三——数据清洗