python for android : BeautifulSoup 有 bug

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python for android : BeautifulSoup 有 bug相关的知识,希望对你有一定的参考价值。

BeautifulSoup 善于网页数据分析 。可是 python for android : BeautifulSoup 有 bug ,

text = h4.a.text 仅仅能取得 None,因此我写了function: getText() 来fix this bug.

比如: 抓取CSDN极客头条内容  soup.py

import urllib2, re
from BeautifulSoup import BeautifulSoup
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)

def getText(text):
    begin = text.find(‘>‘,0)
    if begin > -1:
        begin += 1
        end = text.find(‘</a>‘,begin)
        if begin < end:
            return text[begin:end].strip()
        else:
            return None
    else:
        return None

page = urllib2.urlopen("http://geek.csdn.net/new")
soup = BeautifulSoup(page)
for h4 in soup.findAll(‘h4‘):
    if h4.a is not None:
        href = h4.a.get(‘href‘)
        text = getText(str(h4.a))
        print text
        print href
page.close()

请參考:   http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html





以上是关于python for android : BeautifulSoup 有 bug的主要内容,如果未能解决你的问题,请参考以下文章

java 07 多态强转

在 Ubuntu 18 上构建 pyjnius 时 python-for-android 失败

Kivy:python-for-android,如何查看 public.mp3 的内容

python for android : BeautifulSoup 有 bug

Python For Android (P4a):添加权限(Permissions)

Python_爬虫_BeautifulSoup网页解析库