Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号

Posted 热爱科技的刘同学

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号相关的知识,希望对你有一定的参考价值。

Python初级人工智能精讲

文章目录

一、写在前面

今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨的AI算法模型:auto_punc,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。

二、七步精讲

代码我已调试过了,下面是操作步骤:

  1. 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:auto_punc.py
  2. 安装所需要的Python 模块:
pip install paddlehub
  1. 准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;
  2. 指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;
  3. Win+R运行cmd,在命令行中输入:python C:/auto_punc.py查看结果;
  4. 稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;
  5. 至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。

三、模型介绍

Ernie百度提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇结构语义等方面的知识,实现模型效果不断进化。

四、进入实战

1.源代码

'''
Paddlehub给一段没有标点符号的文字加上合适的标点符号
'''
# 导入包
import paddlehub as hub

model = hub.Module(name='auto_punc', version='1.0.0')

# 定义方法
def addpunc(txtpath, savetxt):
    f = open(txtpath, encoding = "utf-8")
    # 输出读取到的数据
    txtstr = f.read().split("\\n")
    punc_texts = model.add_puncs(txtstr)
    f.close()
    str1 = "\\n"
    print('转换成功:', str1)
    with open(savetxt, "a", encoding='utf-8') as fc:
        fc.write(str1)  # 写入文件
        fc.write("\\n\\n")
        fc.close()

if __name__ == '__main__':
    # 存放要加标点符号的文字
    txtpath = r'D:\\A\\Project_1\\source.txt'
    # 保存加号标点符号的文字
    savetxt = r'D:\\A\\Project_1\\punc.txt'
    # 调用方法
    addpunc(txtpath, savetxt)

2.运行效果

(1) cmd方面

cmd的运行效果如下:

(2) txt文件运行前后对比

运行前:

运行后:

五、休吃霸王餐

这篇文章里有我创作的第一个人工智能项目,望各位赏脸,来了,就把您的三连留下呗~

六、每日一句

💖你努力样子像星辉、像野风,既美又酷~💖

以上是关于Python初级人工智能精讲用Paddlehub给一段没有标点符号的文字加上合适的标点符号的主要内容,如果未能解决你的问题,请参考以下文章

2019Python开发学习路线(初级入门)

paddlehub 初接触

有关paddlehub的了解

飞桨开发者创意荟:PaddleHub一键部署,AI创意实现原来如此简单

语音识别系列︱paddlehub的开源语音识别模型测试

语音识别系列︱paddlehub的开源语音识别模型测试