Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号
Posted 热爱科技的刘同学
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号相关的知识,希望对你有一定的参考价值。
Python初级人工智能精讲
文章目录
一、写在前面
今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨
的AI算法模型:auto_punc
,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。
二、七步精讲
代码我已调试过了,下面是操作步骤:
- 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:
auto_punc.py
; - 安装所需要的Python 模块:
pip install paddlehub
- 准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;
- 指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;
Win
+R
运行cmd
,在命令行中输入:python C:/auto_punc.py
查看结果;- 稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;
- 至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。
三、模型介绍
Ernie
是百度
提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇
、结构
、语义
等方面的知识,实现模型效果不断进化。
四、进入实战
1.源代码
'''
Paddlehub给一段没有标点符号的文字加上合适的标点符号
'''
# 导入包
import paddlehub as hub
model = hub.Module(name='auto_punc', version='1.0.0')
# 定义方法
def addpunc(txtpath, savetxt):
f = open(txtpath, encoding = "utf-8")
# 输出读取到的数据
txtstr = f.read().split("\\n")
punc_texts = model.add_puncs(txtstr)
f.close()
str1 = "\\n"
print('转换成功:', str1)
with open(savetxt, "a", encoding='utf-8') as fc:
fc.write(str1) # 写入文件
fc.write("\\n\\n")
fc.close()
if __name__ == '__main__':
# 存放要加标点符号的文字
txtpath = r'D:\\A\\Project_1\\source.txt'
# 保存加号标点符号的文字
savetxt = r'D:\\A\\Project_1\\punc.txt'
# 调用方法
addpunc(txtpath, savetxt)
2.运行效果
(1) cmd方面
cmd的运行效果如下:
(2) txt文件运行前后对比
运行前:
运行后:
五、休吃霸王餐
这篇文章里有我创作的第一个人工智能项目,望各位赏脸,来了,就把您的三连留下呗~
六、每日一句
💖你努力样子像星辉、像野风,既美又酷~💖
以上是关于Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号的主要内容,如果未能解决你的问题,请参考以下文章