大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具HanLP

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具HanLP相关的知识,希望对你有一定的参考价值。

在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。
技术分享图片
图:大快搜索获评“2018中国大数据基础软件领域领军企业”
在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领中国大数据产业发展的创新技术》。在本书的第一章节收录介绍了大快搜索自主研发的Hanlp技术。
技术分享图片
图:数据之翼-引领中国大数据产业发展的创新技术
Hanlp是由大快搜索高级研究员何晗主导开发的完全开源的项目,具有精度高、速度快、内存省的特点。
2014年,还在攻读日语本科的何晗(大快搜索高级研究员)一定没想到,机缘巧合研发的一款中文分词器,在随后几年中几经迭代,并在商用市场大放异彩。
而看似是“无心插柳柳成荫”的事情,却凝聚着何晗对Hanlp工匠式的锤炼。
Hanlp是由一系列模型与算法组成的工具包,目标是普及自然语言处理(NLP)在生产环境中的应用。Hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点:能够提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。

以上是关于大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具HanLP的主要内容,如果未能解决你的问题,请参考以下文章

2022年半导体技术发展与人才培养创新论坛暨《半导体简史》新书发布会成功召开

TDengine荣获 2022 金猿奖“大数据产业最具投资价值企业”“大数据产业创新技术突破”

观点 | 杜勇:公交大数据技术创新与应用

科技政策河北省工信厅:河北省大数据产业创新发展提升行动计划(2020-2022年)

盘古开源:构建“1468”发展体系,推动“十四五”大数据产业创新发展

盘古开源:构建“1468”发展体系,推动“十四五”大数据产业创新发展