字符串文件操作,英文词频统计预处理
Posted lb2016
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符串文件操作,英文词频统计预处理相关的知识,希望对你有一定的参考价值。
1.字符串操作:
1.1解析身份证号:生日、性别、出生地等。
# -*- coding : utf-8 -*- IdCard=input(‘请你输入18位身份证号码‘) while(len(IdCard)!=18): print(‘你输入的身份证号码长度有误,请你重新输入‘) IdCard=input() if(len(IdCard)==18): print(‘你的身份证号码为‘+IdCard) year=IdCard[6:10]; month=IdCard[10:12]; day=IdCard[12:14]; print("你的出生年月日为:"+year+"年"+month+"月"+day+"日"); if int(IdCard[16])%2 ==0: print("你的性别为女"); else: print("你的性别为男");
1.2 凯撒密码编码与解码
ksmm=input(‘请输入你要加密的英文单词:‘) str=‘‘ ksmm=ksmm.lower() for i in range(len(ksmm)): ksmm.split() if(ord(ksmm[i]) >=99 and ord(ksmm[i]) <=999): str=str + (chr(ord(ksmm[i])+7)) else: str = str + ksmm[i] print(str)
1.3网址观察与批量生成
import webbrowser as web url=‘http://news.gzcc.cn/html/xiaoyuanxinwen/‘ web.open_new_tab(url) for i in range(2,4): web.open_new_tab(‘http://news.gzcc.cn/html/xiaoyuanxinwen/‘+str(i)+‘.html‘)
2.英文词频统计预处理
- 下载一首英文的歌词或文章或小说,保存为utf8文件。
- 从文件读出字符串。
- 将所有大写转换为小写
- 将所有其他做分隔符(,.?!)替换为空格
- 分隔出一个一个的单词
- 并统计单词出现的次数。
f = open(‘C:\\Users\\unliee\\Desktop\\hello_1.txt‘,‘r‘,encoding=‘utf-8‘) text = f.read() print(text) print(text.split()) print(text.count(‘big‘),text.count(‘world‘)) f.close()
以上是关于字符串文件操作,英文词频统计预处理的主要内容,如果未能解决你的问题,请参考以下文章