Python 自动化指南(繁琐工作自动化)第二版:八输入验证

Posted 布客飞龙

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 自动化指南(繁琐工作自动化)第二版:八输入验证相关的知识,希望对你有一定的参考价值。

原文:https://automatetheboringstuff.com/2e/chapter8/

输入验证代码检查用户输入的值,比如来自input()函数的文本,格式是否正确。例如,如果您希望用户输入他们的年龄,您的代码不应该接受无意义的答案,如负数(在可接受的整数范围之外)或单词(这是错误的数据类型)。输入验证还可以防止错误或安全漏洞。如果您实现了一个withdrawFromAccount()函数,该函数接受一个参数作为要从帐户中减去的金额,那么您需要确保该金额是一个正数。如果withdrawFromAccount()函数从账户中减去一个负数,那么“取款”将会增加钱!

通常,我们通过反复要求用户输入来执行输入验证,直到他们输入有效文本,如下例所示:

while True:
    print('Enter your age:')
    age = input()
    try:
        age = int(age)
    except:
        print('Please use numeric digits.')
        continue
    if age < 1:
        print('Please enter a positive number.')
        continue
    break
print(f'Your age is age.')

当您运行此程序时,输出可能如下所示:

Enter your age:
five
Please use numeric digits.
Enter your age:
-2
Please enter a positive number.
Enter your age:
30
Your age is 30.

当您运行此代码时,系统会提示您输入年龄,直到您输入一个有效的年龄。这确保了当执行离开while循环时,age变量将包含一个不会在以后使程序崩溃的有效值。

然而,为程序中的每个input()调用编写输入验证代码很快就变得乏味了。此外,您可能会错过某些情况,并允许无效的输入通过您的检查。在本章中,您将学习如何使用第三方 PyInputPlus 模块进行输入验证。

PyInputPlus 模块

PyInputPlus 包含类似于input()的函数,用于几种数据:数字、日期、电子邮件地址等等。如果用户输入了无效的输入,比如格式错误的日期或超出预期范围的数字,PyInputPlus 将重新提示用户输入,就像上一节中我们的代码所做的那样。PyInputPlus 还有其他有用的特性,比如限制它重新提示用户的次数,如果要求用户在限定的时间内做出响应,还会超时。

PyInputPlus 不是 Python 标准库的一部分,所以必须使用 PIP 单独安装。要安装 PyInputPlus,请从命令行运行pip install --user pyinputplus。附录 A 有安装第三方模块的完整说明。要检查 PyInputPlus 是否安装正确,请在交互式 Shell 中导入它:

>>> import pyinputplus

如果在导入模块时没有出现错误,则说明该模块已成功安装。

PyInputPlus 有几个用于不同类型输入的函数:

inputStr()类似于内置的input()函数,但是具有 PyInputPlus 的一般特性。您还可以向它传递一个自定义验证函数

inputNum()确保用户输入一个数字并返回一个intfloat,这取决于数字中是否有小数点

inputChoice()确保用户输入所提供的选项之一

inputMenu()类似于inputChoice(),但是提供了一个带有数字或字母选项的菜单

inputDatetime()确保用户输入日期和时间

inputYesNo()确保用户输入“是”或“否”的回答

inputBool()inputYesNo()类似,但是接受“真”或“假”响应并返回一个布尔值

inputEmail()确保用户输入有效的电子邮件地址

inputFilepath()确保用户输入有效的文件路径和文件名,并且可以选择性地检查具有该名称的文件是否存在

inputPassword()类似于内置的input(),但是在用户输入时显示*字符,这样密码或其他敏感信息就不会显示在屏幕上

只要用户输入无效的输入,这些函数就会自动重新提示用户:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum()
five
'five' is not a number.
42
>>> response
42

每次我们想调用 PyInputPlus 函数时,import语句中的as pyip代码可以避免我们键入pyinputplus。相反,我们可以使用更短的pyip名称。如果你看一下这个例子,你会发现不像input(),这些函数返回一个intfloat值:423.14,而不是字符串'42''3.14'

正如您可以将一个字符串传递给input()来提供提示一样,您也可以将一个字符串传递给 PyInputPlus 函数的prompt关键字参数来显示提示:

>>> response = input('Enter a number: ')
Enter a number: 42
>>> response
'42'
>>> import pyinputplus as pyip
>>> response = pyip.inputInt(prompt='Enter a number: ')
Enter a number: cat
'cat' is not an integer.
Enter a number: 42
>>> response
42

使用 Python 的help()函数来了解关于这些函数的更多信息。例如,help(pyip.inputChoice)显示inputChoice()函数的帮助信息。完整的文档可以在pyinputplus.readthedocs.io找到。

与 Python 的内置input()不同,PyInputPlus 函数有几个额外的输入验证特性,如下一节所示。

关键字参数

接受intfloat数的inputNum()inputInt()inputFloat()函数也有用于指定有效值范围的minmaxgreaterThanlessThan关键字参数。例如,在交互式 Shell 中输入以下内容:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum('Enter num: ', min=4)
Enter num:3
Input must be at minimum 4.
Enter num:4
>>> response
4
>>> response = pyip.inputNum('Enter num: ', greaterThan=4)
Enter num: 4
Input must be greater than 4.
Enter num: 5
>>> response
5
>>> response = pyip.inputNum('>', min=4, lessThan=6)
Enter num: 6
Input must be less than 6.
Enter num: 3
Input must be at minimum 4.
Enter num: 4
>>> response
4

这些关键字参数是可选的,但是如果提供的话,输入不能小于min参数或大于max参数(尽管输入可以等于它们)。同样,输入必须大于greaterThan并且小于lessThan参数(也就是说,输入不能等于它们)。

blank关键字参数

默认情况下,不允许空白输入,除非blank关键字参数设置为True:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum('Enter num: ')
Enter num:(blank input entered here)
Blank values are not allowed.
Enter num: 42
>>> response
42
>>> response = pyip.inputNum(blank=True)
(blank input entered here)
>>> response
''

如果你想让输入可选,用户不需要输入任何东西,使用blank=True

limittimeoutdefault关键字参数

默认情况下,PyInputPlus 函数将永远(或者只要程序运行)继续要求用户输入有效的数据。如果你想让一个函数在一定次数的尝试或一定时间后停止要求用户输入,你可以使用关键字参数limittimeout。为limit关键字参数传递一个整数,以确定 PyInputPlus 函数在放弃之前尝试接收有效输入的次数,为timeout关键字参数传递一个整数,以确定在 PyInputPlus 函数放弃之前用户必须输入有效输入的秒数。

如果用户未能输入有效的输入,这些关键字参数将导致函数分别引发一个RetryLimitExceptionTimeoutException。例如,在交互式 Shell 中输入以下内容:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum(limit=2)
blah
'blah' is not a number.
Enter num: number
'number' is not a number.
Traceback (most recent call last):
    --snip--
pyinputplus.RetryLimitException
>>> response = pyip.inputNum(timeout=10)
42 (entered after 10 seconds of waiting)
Traceback (most recent call last):
    --snip--
pyinputplus.TimeoutException

当您使用这些关键字参数并传递一个default关键字参数时,该函数将返回默认值,而不是引发异常。在交互式 Shell 中输入以下内容:

>>> response = pyip.inputNum(limit=2, default='N/A')
hello
'hello' is not a number.
world
'world' is not a number.
>>> response
'N/A'

inputNum()函数只是返回字符串'N/A',而不是引发RetryLimitException

allowRegexesblockRegexes关键字参数

您还可以使用正则表达式来指定是否允许输入。allowRegexesblockRegexes关键字参数采用正则表达式字符串列表来确定 PyInputPlus 函数将接受或拒绝哪些有效输入。例如,在交互式 Shell 中输入以下代码,以便inputNum()除了接受常用数字之外,还接受罗马数字:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum(allowRegexes=[r'(I|V|X|L|C|D|M)+', r'zero'])
XLII
>>> response
'XLII'
>>> response = pyip.inputNum(allowRegexes=[r'(i|v|x|l|c|d|m)+', r'zero'])
xlii
>>> response
'xlii'

当然,这个正则表达式只影响inputNum()函数从用户那里接受的字母;该函数仍将接受带有无效排序的罗马数字,如'XVX''MILLI',因为r'(I|V|X|L|C|D|M)+'正则表达式接受这些字符串。

还可以通过使用blockRegexes关键字参数来指定 PyInputPlus 函数不接受的正则表达式字符串列表。在交互式 Shell 中输入以下内容,以便inputNum()不接受偶数:

>>> import pyinputplus as pyip
>>> response = pyip.inputNum(blockRegexes=[r'[02468]

如果同时指定了`allowRegexes`和`blockRegexes`参数,允许列表将覆盖阻止列表。例如,在交互式 Shell 中输入以下内容,它允许使用`'caterpillar'`和`'category'`,但阻止任何包含`'cat'`的内容:

```py
>>> import pyinputplus as pyip
>>> response = pyip.inputStr(allowRegexes=[r'caterpillar', 'category'],
blockRegexes=[r'cat'])
cat
This response is invalid.
catastrophe
This response is invalid.
category
>>> response
'category'

PyInputPlus 模块的函数可以让您不必自己编写繁琐的输入验证代码。但是 PyInputPlus 模块有比这里详细描述的更多的内容。你可以在pyinputplus.readthedocs.io的在线查看它的完整文档。

inputCustom()传递自定义验证函数

通过将函数传递给inputCustom(),您可以编写一个函数来执行您自己的定制验证逻辑。例如,假设您希望用户输入一系列数字,其总和为 10。没有pyinputplus.inputAddsUpToTen()函数,但是您可以创建自己的函数:

  • 接受用户输入内容的单个字符串参数
  • 如果字符串验证失败,将引发异常
  • 如果inputCustom()应该返回不变的字符串,则返回None(或者没有return语句)
  • 如果inputCustom()应该返回一个不同于用户输入的字符串,则返回一个非None
  • 作为第一个参数传递给inputCustom()

比如我们可以创建自己的addsUpToTen()函数,然后传递给inputCustom()。注意,函数调用看起来像inputCustom(addsUpToTen)而不是inputCustom(addsUpToTen()),因为我们将addsUpToTen()函数本身传递给inputCustom(),而不是调用addsUpToTen()并传递它的返回值。

>>> import pyinputplus as pyip
>>> def addsUpToTen(numbers):
...   numbersList = list(numbers)
...   for i, digit in enumerate(numbersList):
...     numbersList[i] = int(digit)
...   if sum(numbersList) != 10:
...     raise Exception('The digits must add up to 10, not %s.' %
(sum(numbersList)))
...   return int(numbers) # Return an int form of numbers.
...
>>> response = pyip.inputCustom(addsUpToTen) # No parentheses after
addsUpToTen here.
123
The digits must add up to 10, not 6.
1235
The digits must add up to 10, not 11.
1234
>>> response # inputStr() returned an int, not a string.
1234
>>> response = pyip.inputCustom(addsUpToTen)
hello
invalid literal for int() with base 10: 'h'
55
>>> response

inputCustom()函数还支持一般的 PyInputPlus 特性,例如blanklimittimeoutdefaultallowRegexesblockRegexes关键字参数。当很难或不可能为有效输入编写正则表达式时,编写自己的自定义验证函数是有用的,如在“加起来等于 10”的例子中。

项目:如何让一个白痴忙上好几个小时

让我们使用 PyInputPlus 来创建一个简单的程序,它执行以下操作:

  1. 问用户是否想知道如何让一个白痴忙上几个小时。
  2. 如果用户回答否,退出。
  3. 如果用户回答是,请转到第一步。

当然,我们不知道用户是否会输入除“是”或“否”之外的内容,所以我们需要执行输入验证。对于用户来说,能够输入yn而不是完整的单词也是很方便的。PyInputPlus 的inputYesNo()函数将为我们处理这个问题,并且无论用户输入的是哪种情况,都会返回一个小写的'yes''no'字符串值。

当您运行这个程序时,它看起来应该如下所示:

Want to know how to keep an idiot busy for hours?
sure
'sure' is not a valid yes/no response.
Want to know how to keep an idiot busy for hours?
yes
Want to know how to keep an idiot busy for hours?
y
Want to know how to keep an idiot busy for hours?
Yes
Want to know how to keep an idiot busy for hours?
YES
Want to know how to keep an idiot busy for hours?
YES!!!!!!
'YES!!!!!!' is not a valid yes/no response.
Want to know how to keep an idiot busy for hours?
TELL ME HOW TO KEEP AN IDIOT BUSY FOR HOURS.
'TELL ME HOW TO KEEP AN IDIOT BUSY FOR HOURS.' is not a valid yes/no response.
Want to know how to keep an idiot busy for hours?
no
Thank you. Have a nice day.

打开一个新的文件编辑器标签,保存为idiot.py。然后输入以下代码:

import pyinputplus as pyip

这将导入 PyInputPlus 模块。由于输入pyinputplus有点麻烦,我们将简称为pyip

while True:
    prompt = 'Want to know how to keep an idiot busy for hours?\\n'
    response = pyip.inputYesNo(prompt)

接下来,while True:创建一个无限循环,该循环将继续运行,直到遇到一个break语句。在这个循环中,我们调用pyip.inputYesNo()来确保这个函数调用不会返回,直到用户输入一个有效的答案。

    if response == 'no':
        break

保证调用pyip.inputYesNo()只返回字符串yes或字符串no。如果它返回了no,那么我们的程序就跳出了无限循环,继续执行最后一行,感谢用户:

print('Thank you. Have a nice day.')

否则,循环再次迭代。

你也可以通过传递关键字参数yesValnoVal在非英语语言中使用inputYesNo()函数。例如,这个程序的西班牙语版本会有这两行:

    prompt = '¿Quieres saber cómo mantener ocupado a un idiota durante horas?\\n'
    response = pyip.inputYesNo(prompt, yesVal='sí', noVal='no')
    if response == 'sí':

现在用户可以输入s(小写或大写)来代替yesy来得到肯定的答案。

项目:乘法竞猜

PyInputPlus 的特性对于创建一个定时乘法测验很有用。通过将allowRegexesblockRegexestimeoutlimit关键字参数设置为pyip.inputStr(),可以将大部分实现留给 PyInputPlus。你需要写的代码越少,你写程序的速度就越快。让我们创建一个程序,向用户提出 10 个乘法问题,其中有效输入是问题的正确答案。打开一个新的文件编辑器选项卡,将文件保存为multiplicationQuiz.py

首先,我们将导入pyinputplusrandomtime。我们将使用变量numberOfQuestionscorrectAnswers来跟踪程序问了多少问题以及用户给出了多少正确答案。一个for循环将重复提出 10 次随机乘法问题:

import pyinputplus as pyip
import random, time
numberOfQuestions = 10
correctAnswers = 0
for questionNumber in range(numberOfQuestions):

for循环中,程序将选择两个一位数相乘。我们将使用这些数字为用户创建一个#Q: N × N =提示,其中Q是问题编号(1 到 10)N是要相乘的两个数字。

    # Pick two random numbers:
    num1 = random.randint(0, 9)
    num2 = random.randint(0, 9)
    prompt = '#%s: %s x %s = ' % (questionNumber, num1, num2)

pyip.inputStr()函数将处理这个测验程序的大部分功能。我们传递给allowRegexes的参数是一个包含正则表达式字符串'^%s$'的列表,其中%s被正确的答案替换。^%字符确保答案以正确的数字开始和结束,尽管 PyInputPlus 会首先删除用户回答开头和结尾的任何空格,以防他们在回答之前或之后无意中按了空格键。我们传递给blocklistRegexes的参数是一个带有('.*', 'Incorrect!')的列表。元组中的第一个字符串是匹配所有可能字符串的正则表达式。因此,如果用户的回答与正确答案不匹配,程序将拒绝他们提供的任何其他答案。在这种情况下,将显示'Incorrect!'字符串,并提示用户再次回答。此外,通过timeout8limit3将确保用户只有 8 秒和 3 次尝试来提供正确答案:

    try:
        # Right answers are handled by allowRegexes.
        # Wrong answers are handled by blockRegexes, with a custom message.
        pyip.inputStr(prompt, allowRegexes=['^%s$' % (num1 * num2)],
                              blockRegexes=[('.*', 'Incorrect!')],
                              timeout=8, limit=3)

如果用户在 8 秒超时后回答,即使他们回答正确,pyip.inputStr()也会引发TimeoutException异常。如果用户错误回答超过 3 次,就会引发一个RetryLimitException异常。这两种异常类型都在 PyInputPlus 模块中,所以pyip.需要预先考虑它们:

    except pyip.TimeoutException:
        print('Out of time!')
    except pyip.RetryLimitException:
        print('Out of tries!')

记住,就像else块可以跟随一个ifelif块一样,它们可以选择跟随最后一个except块。如果在try块中没有出现异常,下面的else块中的代码将会运行。在我们的例子中,这意味着如果用户输入了正确的答案,代码就会运行:

    else:
        # This block runs if no exceptions were raised in the try block.
        print('Correct!')
        correctAnswers += 1

不管是三条信息中的哪一条,“超时!”、“超出尝试次数!”,或者“正确!”,显示,让我们在for循环结束时暂停 1 秒钟,让用户有时间阅读。在程序问了 10 个问题并且for循环继续之后,让我们向用户展示他们做出了多少个正确答案:

    time.sleep(1) # Brief pause to let user see the result.
print('Score: %s / %s' % (correctAnswers, numberOfQuestions))

PyInputPlus 非常灵活,您可以在各种各样接受用户键盘输入的程序中使用它,如本章中的程序所示。

总结

很容易忘记编写输入验证代码,但是没有它,您的程序几乎肯定会有 bug。您期望用户输入的值和他们实际输入的值可能完全不同,您的程序需要足够健壮来处理这些异常情况。您可以使用正则表达式来创建自己的输入验证代码,但是对于一般情况,使用现有的模块更容易,比如 PyInputPlus。您可以使用import pyinputplus as pyip导入模块,以便在调用模块函数时输入一个较短的名称。

PyInputPlus 具有用于输入各种输入的函数,包括字符串、数字、日期、是/否、True / False、电子邮件和文件。虽然input()总是返回一个字符串,但是这些函数以适当的数据类型返回值。inputChoice()函数允许您从几个预先选择的选项中选择一个,而inputMenu()还添加了数字或字母以便快速选择。

所有这些函数都有以下标准特性:去掉两边的空白,用timeoutlimit关键字参数设置超时和重试限制,将正则表达式字符串列表传递给allowRegexesblockRegexes以包含或排除特定响应。您将不再需要编写自己繁琐的while循环来检查有效输入并重新提示用户。

如果 PyInputPlus 模块的函数都不符合您的需要,但是您仍然喜欢 PyInputPlus 提供的其他特性,您可以调用inputCustom()并传递您自己的自定义验证函数供 PyInputPlus 使用。pyinputplus.readthedocs.io/en/latest的文档中有 PyInputPlus 函数和附加特性的完整列表。PyInputPlus 在线文档中的内容比本章中描述的要多得多。重新发明轮子是没有用的,学会使用这个模块将使你不必自己编写和调试代码。*

现在您已经掌握了处理和验证文本的专业知识,是时候学习如何读写计算机硬盘上的文件了。

练习题

  1. PyInputPlus 是 Python 标准库自带的吗?

  2. 为什么 PyInputPlus 一般用import pyinputplus as pyip导入?

  3. inputInt()inputFloat()有什么区别?

  4. 如何确保用户使用 PyInputPlus 输入一个介于099之间的整数?

  5. 传递给allowRegexesblockRegexes关键字参数的是什么?

  6. 空白输入三次inputStr(limit=3)做什么?

  7. 空白输入三次inputStr(limit=3, default='hello')做什么?

实践项目

为了练习,编写程序来完成以下任务。

三明治制作器

编写一个程序,询问用户对三明治的偏好。程序应该使用 PyInputPlus 来确保他们输入有效的输入,例如:

  • 使用inputMenu()表示面包类型:小麦、白面包或酸面团。
  • 使用inputMenu()表示蛋白质类型:鸡肉、火鸡、火腿或豆腐。
  • inputYesNo()询问他们是否想要奶酪。
  • 如果是这样,用inputMenu()询问奶酪的种类:切达奶酪、瑞士奶酪或马苏里拉奶酪。
  • inputYesNo()询问他们想要蛋黄酱、芥末、生菜还是西红柿。
  • inputInt()询问他们想要多少三明治。请确保该数字等于或大于 1。

为这些选项中的每一个提供价格,并在用户输入他们的选择后,让您的程序显示总成本。

自己编写乘法小测验

要了解 PyInputPlus 为您做了多少工作,请尝试自己重新创建乘法测验项目,而不要导入它。这个程序会提示用户 10 道乘法题,范围从0 × 09 × 9。您需要实现以下特性:

  • 如果用户输入正确的答案,程序显示“正确!”1 秒钟,然后继续下一个问题。
  • 在程序进入下一个问题之前,用户有三次输入正确答案的机会。
  • 第一次显示问题八秒后,即使用户在八秒限制后输入了正确答案,该问题也会被标记为不正确。

将您的代码与第 196 页的“项目:乘法测验”中使用 PyInputPlus 的代码进行比较。

Python编程快速上手 让繁琐工作自动化pdf

下载地址
如今,人们面临的大多数任务都可以通过编写计算机软件来完成。Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。通过Python编程,我们能够解决现实生活中的很多任务。
本书是一本面向实践的Python编程实用指南。本书的目的,不仅是介绍Python语言的基础知识,而且还通过项目实践教会读者如何应用这些知识和技能。本书的首部分介绍了基本Python编程概念,第二部分介绍了一些不同的任务,通过编写Python程序,可以让计算机自动完成它们。第二部分的每一章都有一些项目程序,供读者学习。每章的末尾还提供了一些习题和深入的实践项目,帮助读者巩固所学的知识。附录部分提供了所有习题的解答。
本书适合任何想要通过Python学习编程的读者,尤其适合缺乏编程基础的初学者。通过阅读本书,读者将能利用强大的编程语言和工具,并且会体会到Python编程的快乐。
Al Sweigart 是一名软件开发者,还教小孩和成人编程。他为初学者写了几本Python 书籍,包括《Python 密码学编程》、《Python 游戏编程快速上手》和《Python 和Pygame 游戏开发指南》。
第一部分Python编程基础
第1章 Python基础 3
1.1 在交互式环境中输入表达式 3
1.2 整型、浮点型和字符串数据类型 6
1.3 字符串连接和复制 6
1.4 在变量中保存值 7
1.4.1 赋值语句 7
1.4.2 变量名 9
1.5 第一个程序 9
1.6 程序剖析 11
1.6.1 注释 11
1.6.2 print()函数 11
1.6.3 input()函数 11
1.6.4 打印用户的名字 12
1.6.5 len()函数 12
1.6.6 str()、int()和float()函数 13
1.7 小结 15
1.8 习题 15
第2章 控制流 17
2.1 布尔值 18
2.2 比较操作符 19
2.3 布尔操作符 20
2.3.1 二元布尔操作符 20
2.3.2 not操作符 21
2.4 混合布尔和比较操作符 21
2.5 控制流的元素 22
2.5.1 条件 22
2.5.2 代码块 22
2.6 程序执行 23
2.7 控制流语句 23
2.7.1 if语句 23
2.7.2 else语句 24
2.7.3 elif语句 25
2.7.4 while循环语句 30
2.7.5 恼人的循环 31
2.7.6 break语句 33
2.7.7 continue语句 34
2.7.8 for循环和range()函数 37
2.7.9 等价的while循环 39
2.7.10 range()的开始、停止和步长参数 39
2.8 导入模块 40from import语句 41
2.9 用sys.exit()提前结束程序 41
2.10 小结 41
2.11 习题 41
第3章 函数 43
3.1 def语句和参数 44
3.2 返回值和return语句 45
3.3 None值 46
3.4 关键字参数和print()47
3.5 局部和全局作用域 48
3.5.1 局部变量不能在全局作用域内使用 48
3.5.2 局部作用域不能使用其他局部作用域内的变量 49
3.5.3 全局变量可以在局部作用域中读取 49
3.5.4 名称相同的局部变量和全局变量 50
3.6 global语句 50
3.7 异常处理 52
3.8 一个小程序:猜数字 54
3.9 小结 55
3.10 习题 56
3.11 实践项目 56
3.11.1 Collatz序列 56
3.11.2 输入验证 57
第4章 列表 59
4.1 列表数据类型 59
4.1.1 用下标取得列表中的单个值 60
4.1.2 负数下标 61
4.1.3 利用切片取得子列表 61
4.1.4 用len()取得列表的长度 62
4.1.5 用下标改变列表中的值 62
4.1.6 列表连接和列表复制 62
4.1.7 用del语句从列表中删除值 63
4.2 使用列表 63
4.2.1 列表用于循环 64
4.2.2 in和notin操作符 65
4.2.3 多重赋值技巧 66
4.3 增强的赋值操作 66
4.4 方法 67
4.4.1 用index()方法在列表中查找值 67
4.4.2 用append()和insert()方法在列表中添加值 68
4.4.3 用remove()方法从列表中删除值 69
4.4.4 用sort()方法将列表中的值排序 69
4.5 例子程序:神奇8球和列表 70
4.6 类似列表的类型:字符串和元组 71
4.6.1 可变和不可变数据类型 72
4.6.2 元组数据类型 73
4.6.3 用list()和tuple()函数来转换类型 74
4.7 引用 75
4.7.1 传递引用 76
4.7.2 copy模块的copy()和deepcopy()函数 77
4.8 小结 78
4.9 习题 78
4.10 实践项目 79
4.10.1 逗号代码 79
4.10.2 字符图网格 79
第5章 字典和结构化数据 81
5.1 字典数据类型 81
5.1.1 字典与列表 82
5.1.2 keys()、values()和items()方法 83
5.1.3 检查字典中是否存在键或值 84
5.1.4 get()方法 84
5.1.5 setdefault()方法 85
5.2 漂亮打印 86
5.3 使用数据结构对真实世界建模 87
5.3.1 井字棋盘 88
5.3.2 嵌套的字典和列表 91
5.4 小结 92
5.5 习题 93
5.6 实践项目 93
5.6.1 好玩游戏的物品清单 93
5.6.2 列表到字典的函数,针对好玩游戏物品清单 94
第6章 字符串操作 95
6.1 处理字符串 95
6.1.1 字符串字面量 95
6.1.2 双引号 96
6.1.3 转义字符 96
6.1.4 原始字符串 96
6.1.5 用三重引号的多行字符串 97
6.1.6 多行注释 97
6.1.7 字符串下标和切片 98
6.1.8 字符串的in和notin操作符 98
6.2 有用的字符串方法 99
6.2.1 字符串方法upper()、lower()、isupper()和islower()99
6.2.2 isX字符串方法 100
6.2.3 字符串方法startswith()和endswith()102
6.2.4 字符串方法join()和split()102
6.2.5 用rjust()、ljust()和center()方法对齐文本 103
6.2.6 用strip()、rstrip()和lstrip()删除空白字符 104
6.2.7 用pyperclip模块拷贝粘贴字符串 105
6.3 项目:口令保管箱 106
第1步:程序设计和数据结构 106
第2步:处理命令行参数 106
第3步:复制正确的口令 107
6.4 项目:在Wiki标记中添加无序列表 108
第1步:从剪贴板中复制和粘贴 108
第2步:分离文本中的行,并添加星号 109
第3步:连接修改过的行 109
6.5 小结 110
6.6 习题 110
6.7 实践项目 111
表格打印 111
第二部分 自动化任务
第7章 模式匹配与正则表达式 115
7.1 不用正则表达式来查找文本模式 116
7.2 用正则表达式查找文本模式 117
7.2.1 创建正则表达式对象 118
7.2.2 匹配Regex对象 118
7.2.3 正则表达式匹配复习 119
7.3 用正则表达式匹配更多模式 119
7.3.1 利用括号分组 119
7.3.2 用管道匹配多个分组 120
7.3.3 用问号实现可选匹配 121
7.3.4 用星号匹配零次或多次 121
7.3.5 用加号匹配一次或多次 122
7.3.6 用花括号匹配特定次数 122
7.4 贪心和非贪心匹配 123
7.5 findall()方法 124
7.6 字符分类 124
7.7 建立自己的字符分类 125
7.8 插入字符和美元字符 126
7.9 通配字符 126
7.9.1 用点—星匹配所有字符 127
7.9.2 用句点字符匹配换行 127
7.10 正则表达式符号复习 128
7.11 不区分大小写的匹配 128
7.12 用sub()方法替换字符串 129
7.13 管理复杂的正则表达式 129
7.14 组合使用re.IGNORECASE、re.DOTALL和re.VERBOSE 130
7.15 项目:电话号码和Email地址提取程序 130
第1步:为电话号码创建一个正则表达式 131
第2步:为email地址创建一个正则表达式 132
第3步:在剪贴板文本中找到所有匹配 132
第4步:所有匹配连接成一个字符串,复制到剪贴板 133
第5步:运行程序 133
第6步:类似程序的构想 134
7.16 小结 134
7.17 习题 134
7.18 实践项目 136
7.18.1 强口令检测 136
7.18.2 strip()的正则表达式版本 136
第8章 读写文件 137
8.1 文件与文件路径 137
8.1.1 Windows上的倒斜杠以及OS X和Linux上的正斜杠 138
8.1.2 当前工作目录 139
8.1.3 绝对路径与相对路径 139
8.1.4 用os.makedirs()创建新文件夹 140
8.1.5 os.path模块 140
8.1.6 处理绝对路径和相对路径 141
8.1.7 查看文件大小和文件夹内容 142
8.1.8 检查路径有效性 143
8.2 文件读写过程 144
8.2.1 用open()函数打开文件 145
8.2.2 读取文件内容 145
8.2.3 写入文件 146
8.3 用shelve模块保存变量 147
8.4 用pprint.pformat()函数保存变量 148
8.5 项目:生成随机的测验试卷文件 149
第1步:将测验数据保存在一个字典中 149
第2步:创建测验文件,并打乱问题的次序 150
第3步:创建答案选项 151
第4步:将内容写入测验试卷和答案文件 151
8.6 项目:多重剪贴板 153
第1步:注释和shelf设置 153
第2步:用一个关键字保存剪贴板内容 154
第3步:列出关键字和加载关键字的内容 154
8.7 小结 155
8.8 习题 155
8.9 实践项目 156
8.9.1 扩展多重剪贴板 156
8.9.2 疯狂填词 156
8.9.3 正则表达式查找 156
第9章 组织文件 157
9.1 shutil模块 158
9.1.1 复制文件和文件夹 158
9.1.2 文件和文件夹的移动与改名 158
9.1.3 永久删除文件和文件夹 160
9.1.4 用send2trash模块安全地删除 160
9.2 遍历目录树 161
9.7 用zipfile模块压缩文件 162
9.3.1 读取ZIP文件 163
9.3.2 从ZIP文件中解压缩 164
9.3.3 创建和添加到ZIP文件 164
9.4 项目:将带有美国风格日期的文件改名为欧洲风格日期 165
第1步:为美国风格的日期创建一个正则表达式 165
第2步:识别文件名中的日期部分 166
第3步:构成新文件名,并对文件改名 167
第4步:类似程序的想法 168
9.5 项目:将一个文件夹备份到一个ZIP文件 168
第1步:弄清楚ZIP文件的名称 168
第2步:创建新ZIP文件 169
第3步:遍历目录树并添加到ZIP文件。170
第4步:类似程序的想法 170
9.6 小结 171
9.7 习题 171
9.8 实践项目 171
9.8.1 选择性拷贝 171
9.8.2 删除不需要的文件 172
9.8.3 消除缺失的编号 172
第10章 调试 173
10.1 抛出异常 174
10.2 取得反向跟踪的字符串 175
10.3 断言 176
10.3.1 在交通灯模拟中使用断言 177
10.3.2 禁用断言 178
10.4 日志 178
10.4.1 使用日志模块 178
10.4.2 不要用print()调试 180
10.4.3 日志级别 180
10.4.4 禁用日志 181
10.4.5 将日志记录到文件 182
10.5 IDLE的调试器 182
10.5.1 Go 183
10.5.2 Step 183
10.5.3 Over 183
10.5.4 Out 183
10.5.5 Quit 183
10.5.6 调试一个数字相加的程序 184
10.5.7 断点 185
10.6 小结 187
10.7 习题 187
10.7 实践项目 188
调试硬币抛掷 188
第11章 从Web抓取信息 189
11.1 项目:利用webbrowser模块的mapIt.py 190
第1步:弄清楚URL 190
第2步:处理命令行参数 191
第3步:处理剪贴板内容,加载浏览器 191
第4步:类似程序的想法 192
11.2 用requests模块从Web下载文件 192
11.2.1 用requests.get()函数下载一个网页 193
11.2.2 检查错误 193
10.3 将下载的文件保存到硬盘 194
10.4 HTML 195
10.4.1 学习HTML的资源 195
10.4.2 快速复习 195
10.4.3 查看网页的HTML源代码 196
10.4.4 打开浏览器的开发者工具 197
10.4.5 使用开发者工具来寻找HTML元素 198
10.5 用BeautifulSoup模块解析HTML 199
10.5.1 从HTML创建一个BeautifulSoup对象 200
10.5.2 用select()方法寻找元素 200
10.5.3 通过元素的属性获取数据 202
10.6 项目:“I’mFeelingLucky”Google查找 202
第1步:获取命令行参数,并请求查找页面 203
第2步:找到所有的结果 203第3步:针对每个结果打开Web浏览器 204
第4步:类似程序的想法 205
10.7 项目:下载所有XKCD漫画 205
第1步:设计程序 206
第2步:下载网页 207
第3步:寻找和下载漫画图像 207
第4步:保存图像,找到前一张漫画 208
第4步:类似程序的想法 209
10.8 用selenium模块控制浏览器 210
10.8.1 启动selenium控制的浏览器 210
10.8.2 在页面中寻找元素 211
10.8.3 点击页面 212
10.8.4 填写并提交表单 212
10.8.5 发送特殊键 213
10.8.6 点击浏览器按钮 213
10.8.7 关于selenium的更多信息 214
10.9 小结 214
10.10 习题 214
10.11 实践项目 215
10.11.1 命令行邮件程序 215
10.11.2 图像网站下载 215
10.11.32048215
10.11.4 链接验证 215
第12章 处理Excel电子表格 217
12.1 Excel文档 217
12.2 安装openpyxl模块 218
12.3 读取Excel文档 218
12.3.1 用openpyxl模块打开Excel文档 219
12.3.2 从工作簿中取得工作表 219
12.3.3 从表中取得单元格 220
12.3.4 列字母和数字之间的转换 221
12.3.5 从表中取得行和列 222
12.3.6 工作薄、工作表、单元格 223
12.4 项目:从电子表格中读取数据 223
第1步:读取电子表格数据 224
第2步:填充数据结构 225
第3步:将结果写入文件 226
第4步:类似程序的思想 227
12.5 写入Excel文档 227
12.5.1 创建并保存Excel文档 227
12.5.2 创建和删除工作表 228
12.5.3 将值写入单元格 229
12.6 项目:更新一个电子表格 229
第1步:利用更新信息建立数据结构 230
第2步:检查所有行,更新不正确的价格 231
第4步:类似程序的思想 231
12.7 设置单元格的字体风格 232
12.8 Font对象 232
12.9 公式 234
12.10 调整行和列 235
12.10.1 设置行高和列宽 235
12.10.2 合并和拆分单元格 236
12.10.3 冻结窗格 237
12.10.4 图表 238
12.11 小结 240
12.11 习题 240
12.12 实践项目 241
12.12.1 乘法表 241
12.12.2 空行插入程序 241
12.12.3 电子表格单元格翻转程序 242
12.12.4 文本文件到电子表格 242
12.12.5 电子表格到文本文件 242
第13章 处理PDF和Word文档 243
13.1 PDF文档 243
13.1.1 从PDF提取文本 244
13.1.2 解密PDF 245
13.1.3 创建PDF 246
13.1.4 拷贝页面 246
13.1.5 旋转页面 247
13.1.6 叠加页面 248
13.1.7 加密PDF 249
13.2 项目:从多个PDF中合并选择的页面 250
第1步:找到所有PDF文件 250
第2步:打开每个PDF文件 251
第3步:添加每一页 252
第4步:保存结果 252
第5步:类似程序的想法 253
13.3 Word文档 253
13.3.1 读取Word文档 254
13.3.2 从.docx文件中取得完整的文本 254
13.3.3 设置Paragraph和Run对象的样式 255
13.3.4 创建带有非默认样式的Word文档 257
13.3.5 Run属性 257
13.3.6 写入Word文档 258
13.3.7 添加标题 260
13.3.8 添加换行符和换页符 261
13.3.9 添加图像 261
13.4 小结 262
13.5 习题 262
13.6 实践项目 263
13.6.1 PDF偏执狂 263
13.6.2 定制邀请函,保存为Word文档 263
13.6.3 暴力PDF口令破解程序 264
第14章 处理CSV文件和JSON数据 265
14.1 csv模块 265
14.2.1 Reader对象 266
14.2.2 在for循环中,从Reader对象读取数据 267
14.2.3 Writer对象 268
14.2.4 delimiter和lineterminator关键字参数 269
14.3 项目:从CSV文件中删除表头 269
第1步:循环遍历每个CSV文件 270
第2步:读入CSV文件 270
第3步:写入CSV文件,没有
第一行 271
第4步:类似程序的想法 272
14.4 JSON和API 272
14.5 json模块 273
14.5.1 用loads()函数读取
JSON 273
14.5.2 用dumps函数写出
JSON 273
14.6 项目:取得当前的天气数据 274
第1步:从命令行参数获取位置 274
第2步:下载JSON数据 275
第3步:加载JSON数据并打印天气 275
第4步:类似程序的想法 277
14.7 小结 277
14.8 习题 277
14.9 实践项目 277
Excel到CSV的转换程序 277
第15章 保持时间、计划任务和启动程序 279
15.1 time模块 279
15.1.1 time.time()函数 279
15.1.2 time.sleep()函数 280
15.2 数字四舍五入 281
15.3 项目:超级秒表 282
第1步:设置程序来记录时间 282
第2步:记录并打印单圈时间 283
第4步:类似程序的想法 283
15.4 datetime模块 284
15.4.1 timedelta数据类型 285
15.4.2 暂停直至特定日期 286
15.4.3 将datetime对象转换为字符串 287
15.4.4 将字符串转换成datetime对象 288
15.5 回顾Python的时间函数 288
15.6 多线程 289
15.6.1 向线程的目标函数传递参数 290
15.6.2 并发问题 291
15.7 项目:多线程XKCD下载程序 291
第1步:修改程序以使用函数 292
第2步:创建并启动线程 293
第3步:等待所有线程结束 293
15.8 从Python启动其他程序 294
15.8.1 向Popen()传递命令行参数 295
15.8.2 TaskScheduler、launchd和
cron 296
15.8.3 用Python打开网站 296
15.8.4 运行其他Python脚本 296
15.8.5 用默认的应用程序打开文件 297
15.9 项目:简单的倒计时程序 298
第1步:倒计时 298
第2步:播放声音文件 298
第3步:类似程序的想法 299
15.10 小结 299
15.11 习题 300
15.12 实践项目 300
15.12.1 美化的秒表 300
15.12.2 计划的Web漫画下载 301
第16章 发送电子邮件和短信 303
16.1 SMTP 303
16.2 发送电子邮件 304
16.2.1 连接到SMTP服务器 304
16.2.2 发送SMTP的“Hello”消息 305
16.2.3 开始TLS加密 306
16.2.4 登录到SMTP服务器 306
16.2.5 发送电子邮件 306
16.2.6 从SMTP服务器断开 307
16.3 IMAP 307
16.4 用IMAP获取和删除电子邮件 307
16.4.1 连接到IMAP服务器 308
16.4.2 登录到IMAP服务器 309
16.4.3 搜索电子邮件 309
16.4.4 选择文件夹 309
16.4.5 执行搜索 310
16.4.6 大小限制 312
16.4.7 取邮件并标记为已读 312
16.4.8 从原始消息中获取电子邮件地址 313
16.4.9 从原始消息中获取正文 314
16.4.10 删除电子邮件 315
16.4.11 从IMAP服务器断开 315
16.5 项目:向会员发送会费提醒电子邮件 316
第1步:打开Excel文件 316
第2步:查找所有未付成员 317
第3步:发送定制的电子邮件提醒 318
16.6 用Twilio发送短信 319
16.6.1 注册Twilio账号 319
16.6.2 发送短信 320
16.7 项目:“只给我发短信”模块 321
16.8 小结 322
16.9 习题 323
16.10 实践项目 323
16.10.1 随机分配家务活的电子邮件程序 323
16.10.2 伞提醒程序 324
16.10.3 自动退订 324
16.10.4 通过电子邮件控制你的电脑 324
第17章 操作图像 327
17.1 计算机图像基础 327
17.1.1 颜色和RGBA值 328
17.1.2 坐标和Box元组 329
17.2 用Pillow操作图像 330
17.2.1 处理Image数据类型 331
17.2.2 裁剪图片 332
17.2.3 复制和粘贴图像到其他图像 333
17.2.4 调整图像大小 335
17.2.5 旋转和翻转图像 336
17.2.6 更改单个像素 338
17.3 项目:添加徽标 339
第1步:打开徽标图像 340
第2步:遍历所有文件并打开图像 341
第3步:调整图像的大小 341
第4步:添加徽标,并保存更改 342
第5步:类似程序的想法 343
17.4 在图像上绘画 344
17.4.1 绘制形状 344
17.4.2 绘制文本 346
17.5 小结 347
17.6 习题 348
17.7 实践项目 348
17.7.1 扩展和修正本章项目的程序 348
17.7.2 在硬盘上识别照片文件夹 349
17.7.3 定制的座位卡 350
第18章 用GUI自动化控制键盘和鼠标 351
18.1 安装pyautogui模块 351
18.2 走对路 352
18.2.1 通过注销关闭所有程序 352
18.2.2 暂停和自动防故障装置 352
18.3 控制鼠标移动 353
18.3.1 移动鼠标 354
18.3.2 获取鼠标位置 354
18.4 项目:“现在鼠标在哪里?”355
第1步:导入模块 355
第2步:编写退出代码和无限循环 355
第3步:获取并打印鼠标坐标。356
18.5 控制鼠标交互 357
18.5.1 点击鼠标 357
18.5.2 拖动鼠标 357
18.5.3 滚动鼠标 359
18.6 处理屏幕 360
18.6.1 获取屏幕快照 360
18.6.2 分析屏幕快照 360
18.7 项目:扩展mouseNow程序 361
18.8 图像识别 362
18.9 控制键盘 363
18.9.1 通过键盘发送一个字符串 363
18.9.2 键名 364
18.9.3 按下和释放键盘 365
18.9.4 热键组合 365
18.10 复习PyAutoGUI的函数 366
18.11 项目:自动填表程序 367
第1步:弄清楚步骤 368
第2步:建立坐标 368
第3步:开始键入数据 370
第4步:处理选择列表和单选按钮 371
第5步:提交表单并等待 372
18.12 小结 372
18.13 习题 373
18.14 实践项目 373
18.14.1 看起来很忙 373
18.14.2 即时通信机器人 373
18.14.3 玩游戏机器人指南 374
附录A 安装第三方模块 375
附录B 运行程序 377
附录C 习题答案 381
· · · · · · (收起)
下载地址









































































































































































































































































































































































































































































































































































以上是关于Python 自动化指南(繁琐工作自动化)第二版:八输入验证的主要内容,如果未能解决你的问题,请参考以下文章

Python 自动化指南(繁琐工作自动化)第二版:二流程控制

Python 自动化指南(繁琐工作自动化)第二版:五字典和结构化数据

Python 自动化指南(繁琐工作自动化)第二版:十八发送电子邮件和短信

Python 自动化指南(繁琐工作自动化)第二版:七使用正则表达式的模式匹配

Python编程快速上手-让繁琐工作自动化-第二章习题及其答案

Python学习的必备书籍