Python 文本处理 论语

Posted 红莲の狮子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 文本处理 论语相关的知识,希望对你有一定的参考价值。

1.问题描述:请编写程序,提取《论语》文档中所有原文内容,输出保存到“论语-提取版.txt”文件。输出文件格式要求:去掉文章中原文部分每行行首空格及如“1.11”等的数字标志,行尾无空格、无空行。参考格式如下(原文中括号及内部数字是对应源文件中注释项的标记):

 

 1 j=7
 2 k=0
 3 a=0
 4 b=0
 5 l=[]
 6 content=[]
 7 
 8 try:
 9     with open(r\'C:\\Users\\DELL\\Desktop\\论语.txt\',\'r\',encoding=\'utf-8\') as file1:
10         for line in file1:
11             newline=line
12             if newline[2:5] in [str(m)+\'·\'+str(n) for m in range(1,25) for n in range(1,25)]\\
13                     or newline[2:6] in [str(m)+\'·\'+str(n) for m in range(1,25) for n in range(1,25)]\\
14                     or newline[2:7] in [str(m)+\'·\'+str(n) for m in range(1,25) for n in range(1,25)]\\
15                     or newline[2:8] in [str(m)+\'·\'+str(n) for m in range(1,25) for n in range(1,25)]:
16                 for p in [str(m)+\'·\'+str(n) for m in range(45,0,-1) for n in range(45,0,-1)]:
17                     if p in newline[0:9]:
18                         newline2=newline.replace(p,\'\')
19                         content.append(newline2)
20                         break
21 
22             else:
23                 content.append(newline)
24 
25 
26     with open(r\'C:\\Users\\DELL\\Desktop\\论语改2.txt\',\'w\',encoding=\'utf-8\') as file2:
27         for i in range(len(content)):
28 
29             if \'【原文】\' in content[i] and i>=b:
30 
31                 a=i
32                 k=i
33 
34                 while k!=0:
35                     if \'\' in content[k+1]:
36                         b=k+1
37                         l.append([a,b])
38                         break
39                     else:
40                         k+=1
41         for m,n in l:
42             for line in content[m+1:n-1]:
43                 file2.write(line)
44 
45 
46 
47 
48 
49 except Exception as t:
50     print(t)

 

以上是关于Python 文本处理 论语的主要内容,如果未能解决你的问题,请参考以下文章

python常用代码片段总结

你如何在 python 中处理 graphql 查询和片段?

如何用Python统计《论语》中每个字的出现次数?10行代码搞定--用计算机学国学

常用python日期日志获取内容循环的代码片段

python+spark程序代码片段

Python二级考试-综合应用题(对网络版的《论语》txt文件进行提纯)