python实现wc
Posted 5185jim
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python实现wc相关的知识,希望对你有一定的参考价值。
wordcount
项目相关要求
wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。
- 具体功能要求:
程序处理用户需求的模式为:wc.exe [parameter] [file_name]
- 基本功能列表:
wc.exe -c file.c
//返回文件 file.c 的字符数(实现)wc.exe -w file.c
//返回文件 file.c 的词的数目(实现)wc.exe -l file.c
//返回文件 file.c 的行数(实现) -
拓展功能:
- -s 递归处理目录下符合条件的文件。(基本实现)
- -a 返回更复杂的数据(代码行 / 空行 / 注释行)。(基本实现)
- 空行:本行全部是空格或格式控制字符,如果包括代码,则
只有不超过一个可显示的字符,例如“{”。 - 代码行:本行包括多于一个字符的代码。
- 注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:
} //注释
在这种情况下,这一行属于注释行。 - [file_name]: 文件或目录名,可以处理一般通配符。(未实现)
- -s 递归处理目录下符合条件的文件。(基本实现)
- 高级功能:
- -x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。(实现)
需求举例:wc.exe -s -a *.c
返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。
GITHUB
https://github.com/06linxi/wordcount
遇到的困难及解决方法
- 困难描述:各种bug
- 做过哪些尝试:百度
- 是否解决:基本解决
- 有何收获:灵活使用搜索工具
关键代码or设计说明
#判断是否是注释行
def isCmt(line, multiCmtFlagIdx):
singleCmtFlag = ‘//‘ # 单行注释符号
startCmtFlag = "/*"
endCmtFlag = "*/"
isCmtRet = True
# print ‘line: ‘ + line.strip()
if multiCmtFlagIdx == False: # 不在多行注释中
# 单行注释
# re.match(pattern, string, flags=0),匹配开头,s是任意空白字符
if re.match(r‘(s)*‘ + singleCmtFlag, line):
return isCmtRet, multiCmtFlagIdx
# 多行注释开始符号
if startCmtFlag in line: # 找到多行注释开始符号
if endCmtFlag in line:
multiCmtFlagIdx = False
return isCmtRet, multiCmtFlagIdx
return isCmtRet, multiCmtFlagIdx
else:
# 没有找到多行注释开始符,继续查找下个类型的符号
multiCmtFlagIdx = False
isCmtRet = False
return isCmtRet, multiCmtFlagIdx
else: # 在多行注释中
# 多行注释开始符
if endCmtFlag in line:
multiCmtFlagIdx = False
# print isCmtRet, multiCmtFlagIdx
return isCmtRet, multiCmtFlagIdx # 返回是否注释行,以及当前是否在多行注释中
#相关计算
def get_count(data):
chars = len(data)
words = len(data.split())
lines = data.count(‘ ‘)
return lines, words, chars
测试运行
PSP
- 实现之前先在PSP中预估时间
- 实施后各个环节实际花费多少时间也请做记录
- 表中有一项: Estimate 指的“预估”这个活动,“预估时间”也是一项任务。
- 例如:我估计自己需要花30分钟来估算出整个项目需要多少时间完成,结果我花了20分钟估算出整个项目需要6个小时完成。Estimate这一项应该在“预估耗时”填写30分钟,实际耗时填写“20”分钟。
- 一级和二级活动的包含关系:
- Planning 这个一级活动包含了1个二级活动(Estimate)
- Development 这个一级活动包含了8个二级活动
- Reporting 这个一级活动包含了3个二级活动
- 大家在记录时间的时候, 只用记录二级活动, 然后把总数加了, 就是相应的一级活动的时间
- 这个时间的长短并不会对分数有直接影响,这是为了大家自己总结。
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 600 | 600 |
· Estimate | · 估计这个任务需要多少时间 | 600 | 600 |
Development | 开发 | 540 | 540 |
· Analysis | · 需求分析 (包括学习新技术) | 60 | 60 |
· Design Spec | · 生成设计文档 | 30 | 30 |
· Design Review | · 设计复审 (和同事审核设计文档) | 30 | 30 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 30 | 30 |
· Design | · 具体设计 | 30 | 30 |
· Coding | · 具体编码 | 300 | 300 |
· Code Review | · 代码复审 | 30 | 30 |
· Test | · 测试(自我测试,修改代码,提交修改) | 30 | 30 |
Reporting | 报告 | 60 | 60 |
· Test Report | · 测试报告 | 40 | 40 |
· Size Measurement | · 计算工作量 | 10 | 10 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 10 | 10 |
合计 | 600 | 600 |
以上是关于python实现wc的主要内容,如果未能解决你的问题,请参考以下文章