python正则表达式统计字符串的个数

Posted songbiao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式统计字符串的个数相关的知识,希望对你有一定的参考价值。

目的:通过python将pubmed下载的摘要txt文档,统计出其中的PMID数目,是否和文献总篇数一致,一致的话,就可以利用PMID的regex pattern进行分割字符串为单篇摘要文献。

import re

fname = \'2020-01-14_endometriosis_2020-01-01_UTF8.txt\'
with open(fname, "r", encoding = \'utf-8\') as f:
    abstracts = f.read()

str = abstracts
iList= re.findall(r"PMID: \\d+ ",str)
print(len(iList)) # output: 6049,符合文档中文献的总篇数

iList= re.findall(r"PMID: \\d+",str) # regex pattern中少一个空格
print(len(iList)) # output: 6050,结果比文档中文献总篇数多了一篇

以上是关于python正则表达式统计字符串的个数的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式统计字符串中数字的个数

python学习:判断字符串中字母数字空格的个数

循环通过 python 正则表达式匹配

java怎么统计字符串内的标点符号?

python 统计单词个数---不去重

字符统计与正则表达式