数据挖掘导论——Python练习
Posted 上山打老虎D
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘导论——Python练习相关的知识,希望对你有一定的参考价值。
实验2:Python练习
- 编写一个名为collatz()的函数,它有一个名为number的参数,如果输入的参数是质数,那么collatz()就打印出number,如果number不是质数,则打印3*number+1。
- 有两个磁盘文件test1.txt和test2.txt,各存放一行字母,要求把这两个文件中的信息合并(按字母顺序排列,每类字母大写在前,小写在后), 输出到一个新文件test3.txt中。
- 某个公司采用公用电话传递数据,数据是四位的整数,在传递过程中是加密的,加密规则如下:每位数字都加上5,然后用和除以10的余数代替该数字,再将第一位和第四位交换,第二位和第三位交换。
- 元素分类。给定如下的集合[11,33,22,44,55,66,77,88,99,90],创建一个字典,第一个键(“min”)对应的值是所有小于66的值,第二个键(“max”)对应的值是所有大于或等于66的值。输出该字典的所有键值对。
- 创建一个名为names的空列表,往里面按顺序添加 Lihua、Rain、Jack、Xiuxiu、Peiqi和Black共6个元素。再分别按照如下3个要求对names进行操作(每个操作不相关):
- 定义一个字典。其中键是字符串,描述清单中的物品,值是一个整型值,说明玩家有多少该物品。例如,字典值'rope': 1, 'torch': 6, 'gold coin': 42, 'dagger': 1, 'arrow': 12。写一个名为 displayInventory()的函数,参数是字典,打印输出物品个数和物品名称,并统计物品总数量。(输出格式参考下图)
- 输入包含数字和字母的字符串,判断:
编写一个名为collatz()的函数,它有一个名为number的参数,如果输入的参数是质数,那么collatz()就打印出number,如果number不是质数,则打印3*number+1。
输入 | 2 | 3 | 4 |
---|---|---|---|
输出 | 2 | 3 | 13 |
代码
import math
def collatz(number):
if number <= 1:
return 3 * number + 1
if number == 2:
return number
i = 2
while i <= math.sqrt(number) + 1:
if number % i == 0:
return 3 * number + 1
i += 1
return number
分析
首先对负数以及小于等于1的数字进行特判,如果是小于等于1的数字则一定不是质数,直接返回三倍number+1的值即可。当输入为2时,为质数,直接返回即可。当输入其他数字时,利用循环,依次取2到number的平方根+1的值进行取余运算,利用遍历对是否存在非1以及其本身的其他因子进行判断。如果存在,则直接返回三倍number+1的值。若穷举后发现不存在,则返回原值即可。
测试
当输入为2时:
当输入为3时:
当输入为4时:
当输入为8时:
当输入为19时:
有两个磁盘文件test1.txt和test2.txt,各存放一行字母,要求把这两个文件中的信息合并(按字母顺序排列,每类字母大写在前,小写在后), 输出到一个新文件test3.txt中。
示例:
注:运行以上程序前,你需要在脚本执行的目录下创建 test1.txt、test2.txt 文件
test1.txt : AbCdEf
test2.txt: HIiJKaBcDeF
test3.txt: AaBbCcDdEeFfHIiJK
代码
with open('test1.txt', 'r+') as f:
tempString = f.read()
with open('test2.txt', 'r+') as f:
tempString += f.read()
print(tempString)
temp = list(tempString)
temp.sort(key=lambda x: 2 * ord(x) if x.isupper() else 2 * ord(x.upper()) + 1)
tempString = "".join(temp)
f = open("test3.txt", "w")
f.write(tempString)
print(tempString)
分析
首先利用文件流读取两个文件并合并成一个字符串,然后将其转成列表,再利用sort函数结合ASCII码,对于大写字母,排序的键为ASCII码的二倍,对于小写字母,排序的键为对应大写字母ASCII码的二倍加一,从而将小写字母插入大写字母中。排序结束后再利用join将列表转换成字符串。最后利用文件流,输出到文件中即可。
测试
Test1.txt:
Test2.txt
Test3.txt
某个公司采用公用电话传递数据,数据是四位的整数,在传递过程中是加密的,加密规则如下:每位数字都加上5,然后用和除以10的余数代替该数字,再将第一位和第四位交换,第二位和第三位交换。
示例:
输入:1234
输出:9876
代码
def encrypt(num):
res = int(num / 1000 + 5) % 10
res += int(num % 1000 / 100 + 5) % 10 * 10
res += int(num % 100 / 10 + 5) % 10 * 100
res += int(num % 10 + 5) % 10 * 1000
return res
print(encrypt(1234))
分析
对于个位数,新数字的个位数即为原数字的千位数,因此对原数字的千位数加五之后对10取模即可
对于十位数,新数字的十位数即为原数字的百位数,因此对原数字的百位数加五之后对10取模即可
对于百位数,新数字的百位数即为原数字的十位数,因此对原数字的十位数加五之后对10取模即可
对于千位数,新数字的千位数即为原数字的个位数,因此对原数字的个位数加五之后对10取模即可
测试
加密前:1234
加密后:9876
元素分类。给定如下的集合[11,33,22,44,55,66,77,88,99,90],创建一个字典,第一个键(“min”)对应的值是所有小于66的值,第二个键(“max”)对应的值是所有大于或等于66的值。输出该字典的所有键值对。
代码
if __name__ == '__main__':
num = [11, 33, 22, 44, 55, 66, 77, 88, 99, 90]
dic = 'min': [], 'max': []
for i in num:
if i < 66:
dic['min'].append(i)
else:
dic['max'].append(i)
print(dic)
分析
首先创建元素列表以及目标字典。利用for循环遍历列表,对于列表中的每个数字,当其小于66时,加入到以min为键的字典中,反之则加入到以max为键的字典中。最后输出结果即可
测试
创建一个名为names的空列表,往里面按顺序添加 Lihua、Rain、Jack、Xiuxiu、Peiqi和Black共6个元素。再分别按照如下3个要求对names进行操作(每个操作不相关):
- 往names列表里Black前面插入一个Blue,后面插入White,输出names列表;
- 把names列表中Xiuxiu的名字替换成“秀秀”,并输出names列表;
- 创建新列表[1,2,3,4,2,5,6,2],将新列表元素追加到names列表末尾,并输出names列表;取出names列表中索引2-10的元素,步长为2,打印所取出的元素。
代码
if __name__ == '__main__':
names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']
names.insert(-1, 'Blue')
names.append('White')
print(names)
if __name__ == '__main__':
names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']
names[names.index('Xiuxiu')] = '秀秀'
print(names)
if __name__ == '__main__':
names = ['Lihua', 'Rain', 'Jack', 'Xiuxiu', 'Peiqi', 'Black']
newList = [1, 2, 3, 4, 2, 5, 6, 2]
names.extend(newList)
print(names)
print(names[2:11:2])
分析
通过利用insert在倒数第二个位置插入’Blue’,通过append在末尾加入’White’
通过利用index函数获取对应内容的下标值之后,再直接进行读写。
通过利用extend函数完成两个列表间的合并操作。利用切片对列表进行切片,从而获取以2开始,步长为2的序列
测试
定义一个字典。其中键是字符串,描述清单中的物品,值是一个整型值,说明玩家有多少该物品。例如,字典值‘rope’: 1, ‘torch’: 6, ‘gold coin’: 42, ‘dagger’: 1, ‘arrow’: 12。写一个名为 displayInventory()的函数,参数是字典,打印输出物品个数和物品名称,并统计物品总数量。(输出格式参考下图)
代码
def displayInventory(dir):
print('Inventory:')
temp = 0
for i in dir.keys():
print(str(dir[i]) + " " + i)
temp += dir[i]
print('Total number of items:' + str(temp))
if __name__ == '__main__':
dir = 'rope': 1, 'torch': 6, 'gold coin': 42, 'dagger': 1, 'arrow': 12
displayInventory(dir)
分析
首先输出“Inventory:”,然后利用for循环遍历整个字典并累加。最后将累加结果输出。
测试
输入包含数字和字母的字符串,判断:
- 该串中是否两类字符[数字和英文字符]都包含?
- 每种字符都唯一?
若两个条件都满足返回”TURE”,否则返回”FALSE”。
示例:
输入: Aabc123 输出:TURE
输入: aabc123 输出:FALSE
输入:Aabc 输出:FALSE
代码
import re
def judge(string0):
if len(string0) != len(set(string0)):
return False
if re.compile(r"[0-9]").findall(string0) and re.compile(r"[a-zA-Z]").findall(string0):
return True
else:
return False
分析
首先利用set,将字符串转化为字符串集合。由于集合的键值元素特性,集合长度即为字符串中拥有的不同字符数,因此当集合长度与字符串长度相等时,字符串每种字符均唯一。
其次,利用正则表达式检索数字与英文字符,当两个正则表达式都匹配时,即说明字符串中两类字符都包含。
测试
以上是关于数据挖掘导论——Python练习的主要内容,如果未能解决你的问题,请参考以下文章