Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

Posted 橙子CX

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释相关的知识,希望对你有一定的参考价值。

这篇文章主要介绍了Pythont特殊语法filter,map,reduce,apply使用方法,需要的朋友可以参考下
(1)lambda

lambda是Python中一个很有用的语法,它允许你快速定义单行最小函数。类似于C语言中的宏,可以用在任何需要函数的地方。

基本语法如下:

函数名 = lambda args1,args2,…,argsn : expression

例如:

add = lambda x,y : x + y
print add(1,2)

(2)filter

filter函数相当于一个过滤器,函数原型为:filter(function,sequence),表示对sequence序列中的每一个元素依次执行function,这里function是一个bool函数,举例说明:

sequence = [1,2,3,4,5,6,7,8,9,10]
fun = lambda x : x % 2 == 0
seq = filter(fun,sequence)
print seq

以下代码就是表示筛选出sequence中的所有偶数。

filter函数原型大致如下:

def filter(fun,seq):
filter_seq = []
for item in seq:
if fun(item):
filter_seq.append(item)
return filter_seq

(3)map

map的基本形式为:map(function,sequence),是将function这个函数作用于sequence序列,然后返回一个最终结果序列。比如:

seq = [1,2,3,4,5,6]
fun = lambda x : x << 2

print map(fun,seq)

map的函数源代码大致如下:

def map(fun,seq):
mapped_seq = []
for item in seq:
mapped_seq.append(fun(item))
return mapped_seq

(4)reduce

reduce函数的形式为:reduce(function,sequence,initVal),function表示一个二元函数,sequence表示要处理的序列,而initVal表示处理的初始值。比如:

seq = [1,2,3,4,5,6,7,8,9,10]
fun = lambda x,y: x + y

print reduce(fun,seq,0)

表示从初始值0开始对序列seq中的每一个元素累加,所以得到结果是55

reduce函数的源代码大致如下:

def reduce(fun,seq,initVal = None):
Lseq = list(seq)
if initVal is None:
res = Lseq.pop(0)
else:
res = initVal
for item in Lseq:
res = fun(seq,item)
return res

(5)apply

apply是用来间接地代替某个函数,比如:

def say(a,b):
print a,b

apply(say,(234,‘Hello World!‘))

推荐我们的python学习基地,看前辈们是如何学习的!从基础的python脚本、爬虫、django、数据挖掘等编程技术,还有整理零基础到项目实战的资料,送给每一位爱学习python的小伙伴!每天都有老前辈定时讲解Python技术,分享一些学习的方法和需要留意的小细节。进裙共同学习,坚持打卡裙号624440745———————————————624440745

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

以上是关于Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫学习日历2基于ubuntu系统beautifulsoup的强大之处

使用Python爬虫库BeautifulSoup遍历文档树并对标签进行操作详解(新手必学)

Python爬虫利器:BeautifulSoup库

python爬虫(十九)BeautifulSoup4库

Python爬虫:想听榜单歌曲?使用BeautifulSoup库只需要14行代码即可搞定

Python爬虫:想听榜单歌曲?使用BeautifulSoup库只需要14行代码即可搞定