python如何从文本中筛选出带指定汉字的句子

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python如何从文本中筛选出带指定汉字的句子相关的知识,希望对你有一定的参考价值。

题主现在有一个文本文档,要在里面筛选出所有带有指定汉字或词语的“句子”(前后30个字),结果输出为一个新文件,求解答。
希望能有完整的代码,感谢!
python是3.6版本

#coding=gbk
#下面就是代码,测试了一下没有问题
#python 2.7.5
def srch(fileName):
f = open(fileName,'r').read()
s = f.split('\n')
a0 = s[0]
for i in range(0,len(s)):
if len(s) == 1: #这一行我不知道有没有用,判断文本是否只有一行
if a0[:1] != '#':
print '0' #return 0
break
a = s[i]
if a[:1] == '#':
print '-1' #return -1
else:
print '0' #return 0

print srch('abc.txt') #abc.txt is your file
参考技术A 建议用正则,即re模块,完整代码什么的,那是不可能的~

mysql--单表中筛选出第二高的薪水

技术图片

 

思路一:(最终的结果如果不存在第二高的薪水的话不会返回null)

技术图片

 

 无论是是使用哪种方法,最终在select后面都要跟一个distinct做到去重的效果

 

 

 

思路二:(解决不能返回null的问题)

  方法一:使用子查询结合limit

  技术图片

 

 

  方法二:使用IFNULL结合limit

  技术图片

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

补充:

1.对limit的基本使用规范

技术图片

 

 

 

2.select 后面如果跟一个为空的结果集,最终输出的结果为null

技术图片

 

以上是关于python如何从文本中筛选出带指定汉字的句子的主要内容,如果未能解决你的问题,请参考以下文章

如何从粉丝页面中筛选出最活跃的用户?

Python 从文件中筛选出ip 正则表达(re)

oracle中从一张表中筛选出不再多个时间段内的时间

我无法从结果中筛选出_id?

EXCEL表一列数据中只筛选出“整数”或是“小数”怎么办????

从文本文件中读取句子并使用 Python 3 附加到列表中 [关闭]