推荐(TensorFlow)深度学习中文分词开源了!98%准确率的深度学习分词系统和语料

Posted 机器学习研究会

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐(TensorFlow)深度学习中文分词开源了!98%准确率的深度学习分词系统和语料相关的知识,希望对你有一定的参考价值。

点击上方 “机器学习研究会”可以订阅哦
摘要
转自:待字闺中
背景
97.5%准确率的深度学习中文分词(字嵌入+Bi-LSTM+CRF)
深度学习当前在NLP领域发展也相当快,翻译,问答,摘要等基本都被深度学习占领了。 本文给出基于深度学习的中文分词实现,借助大规模语料,不需要构造额外手工特征,在2014年人民日报语料上取得97.5%的准确率。模型基本是参考论文:http://www.aclweb.org/anthology/N16-1030

构建

  • 安装好bazel代码构建工具,clone下来tensorflow项目代码,配置好(./configure)

  • 编译后台服务

        bazel build //kcws/cc:seg_backend_api




97.5%准确率的深度学习中文分词(字嵌入+Bi-LSTM+CRF):

http://mp.weixin.qq.com/s?__biz=MzA4NDEyMzc2Mw==&mid=2649676727&idx=2&sn=98a42a08a4acaba209e2c4998e2aff08&chksm=87f672abb081fbbdf6178a8664b3aa2e5f697157f7c745a5275e8007805aa82d97fdd38468e0#rd


代码链接:
https://github.com/koth/kcws

原文链接:
https://mp.weixin.qq.com/s/HNeeFA_OuUAn1ZCzDEa1uA
“完整内容”请点击【阅读原文】
↓↓↓


以上是关于推荐(TensorFlow)深度学习中文分词开源了!98%准确率的深度学习分词系统和语料的主要内容,如果未能解决你的问题,请参考以下文章

爆红Github!中文版开源免费的TensorFlow 2.0书籍来了

阿里深度学习框架开源了!无缝对接TensorFlowPyTorch

问题集录--TensorFlow深度学习

深度学习框架大战:谁将夺取“深度学习工业标准”荣耀?

推荐TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型

掌握谷歌深度学习框架——专访 TensorFlow 贡献者唐源