用webbrowser操作浏览器登录微博后,怎么抓取数据,Python语言

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用webbrowser操作浏览器登录微博后,怎么抓取数据,Python语言相关的知识,希望对你有一定的参考价值。

参考技术A 按我的理解简化如下:
用户在新浪微博给的页面输入账号密码,然后微博给应用一个PIN码,这样应用通过PIN码才有权限访问该用户的信息,而应用在整个过程中是接触不到密码的,所以用户觉得很安全,后果很满意
2:获得认证之后,就可以使用微博SDK提供的API获得信息啦
3:如果想设计web或者客户端应用的话,那就继续加个GUI好啦(未完成)

代码:

#!/usr/bin/python

import webbrowser

from weibopy.auth import OAuthHandler
from weibopy.api import API

AppKey = '2525355147'
AppSecret = '2e2c7bcdfc362eace266d1f2bf83fe6b'

my_auth = OAuthHandler(AppKey , AppSecret)
webbrowser.open(my_auth.get_authorization_url())
verifier = raw_input('PIN: ').strip()
my_auth.get_access_token(verifier)

my_api = API(my_auth)
for comment in my_api.mentions():
object = comment
id = object.__getattribute__("id")
text = object.__getattribute__("text")
print str(id) + " : " + text本回答被提问者采纳
参考技术B 用户在新浪微博给的页面输入账号密码,然后微博给应用一个PIN码,这样应用通过PIN码才有权限访问该用户的信息,而应用在整个过程中是接触不到密码的,所以用户觉得很安全,后果很满意
2:获得认证之后,就可以使用微博SDK提供的API获得信息啦
3:如果想设计web或者客户端应用的话,那就继续加个GUI好啦(未完成)

代码:

#!/usr/bin/python

import webbrowser

from weibopy.auth import OAuthHandler
from weibopy.api import API

AppKey = '2525355147'
AppSecret = '2e2c7bcdfc362eace266d1f2bf83fe6b'

my_auth = OAuthHandler(AppKey , AppSecret)
webbrowser.open(my_auth.get_authorization_url())
verifier = raw_input('PIN: ').strip()
my_auth.get_access_token(verifier)

my_api = API(my_auth)
for comment in my_api.mentions():
object = comment
id = object.__getattribute__("id")
text = object.__getattribute__("text")
print str(id) + " : " + text

webbrowser 登录网页

webbrowser 登录网页
就是自己用vb6.0做的一个浏览器,想打开就自己登录上
现在想的是怎么在打开浏览器的时候,填写上资料,然后自动登录,查了好多资料,老是对象错误
.本人很笨,麻烦高手写详细点,包括变量定义和对象.最好给一个完整可用的代码,一晚上了,脑子要炸了.就这些分了

网站是"my.37.com/login.html?url=http://my.37.com"
Private Sub WebBrowser1_DocumentComplete(ByVal pDisp As Object, URL As Variant)
If pDisp = WebBrowser1.object Then
WebBrowser1.Document.getelementsbytagname("input")("login_account").Value = "ss3870"
WebBrowser1.Document.getelementsbytagname("input")("password").Value = "123456"

End If
End Sub
手动点击登录后,出现实时错误424,要求对象,还有有时会出现脚本错误

参考技术A 此类问题可以用腾讯电脑管家电脑诊所一键修复,请点击上方的【立即修复】即可。
附:手动修复步骤(来源:腾讯电脑管家电脑诊所,自动修复请点击上方的【立即修复】)方案一:手动设置DNS(说明:如果您使用DNS有特殊设置,请保存设置后再进行操作)1.打开【控制面板】→【网络连接】→打开【本地连接】→【属性】:

2.双击【Internet 协议(TCP/IP)】→选择【自动获取IP地址(0)】和【使用下面的DNS服务器地址(B)】→输入首选DNS服务器为"114.114.114.114",备用DNS服务器为"8.8.8.8"→点击【确定】→【确定】:

方案二:清除IE缓存1. 打开IE浏览器→点击【工具】→ 【Internet 选项】→【删除】:
2. 勾选所有选项→点击【确定】→ 在确认窗口中点击【确定】

方案三:注册IE组件点击【开始】菜单→在搜索框中输入"cmd"→按键盘enter(回车)键:在弹出的黑色窗口中,按顺序输入以下内容,按键盘enter(回车)键,再逐一完成以下全部部件注册:

regsvr32 atl.dllregsvr32 shdocvw.dllregsvr32 actxprxy.dllregsvr32 urlmon.dllregsvr32 browseui.dllregsvr32 oleaut32.dllregsvr32 shell32.dllregsvr32 jscript.dllregsvr32 vbscript.dllregsvr32 mshtmled.dllregsvr32 CLBCATQ.DLLregsvr32 cscui.dllregsvr32 MLANG.DLLregsvr32 stobject.dllregsvr32 WINHTTP.dllregsvr32 msxml3.dllregsvr32 query.dllregsvr32 jscript9.dllregsvr32 hlink.dll
建议点击本回答上侧【修复】按钮,使用电脑诊所一键自动完成所有修复步骤。
方案四:启动DNS服务点击【开始】菜单→在搜索框中输入"cmd"→按键盘enter(回车)键:2.在弹出的黑色窗口中,输入”sc coinfig dnscache start= auto”(注意=后的空格),按键盘enter(回车)键→输入”sc start dnscache”,按键盘enter(回车)键,最后输入”ipconfig /flushdns” , 按键盘enter(回车)键:

方案五: 重置winsock目录点击【开始】菜单→在搜索框中输入"cmd"→按键盘enter(回车)键:2.在弹出的黑色窗口中,输入”netsh winsock reset”,按键盘enter(回车)键后重启计算机:

如果以上诉步骤未能生效,再进入后续步骤:方案六:重置IE(说明:如果您使用网络代理或者对浏览器有特殊设置,请保存设置后再进行操作)打开IE浏览器 → 点击【工具】→【Internet 选项】点击【高级】→点击【重置】→勾选【删除个性化设置】→点击【确定】→【确定】:

注:腾讯电脑管家为能上QQ但打不开网页定制部分修复步骤,因为操作过于繁杂,故未全部列出。若问题仍未解决,建议点击本回答上侧的【修复】按钮,进行深度修复。
本回答如有不清楚或其他疑问,请继续追问如果后续有其它问题,也欢迎来腾讯电脑管家企业平台咨询
参考技术B 出现实时错误和脚本错误影响登录吗?如果不影响的话屏蔽掉就可以了;

以上是关于用webbrowser操作浏览器登录微博后,怎么抓取数据,Python语言的主要内容,如果未能解决你的问题,请参考以下文章

webbrowser 登录网页

怎么用VBA或网络爬虫程序抓取网站数据

类似刷新微博后,顶部显示更新数量的动画。

微博转发抽奖怎么弄

C# webbrowser怎么判断登录是不是成功?

微博转发抽奖怎么弄