怎样用delphi 获取网页html源代码(网页需登录)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎样用delphi 获取网页html源代码(网页需登录)相关的知识,希望对你有一定的参考价值。

条件1:窗体上方一个webbrowser,并让他加载一个网站的登录页面;条件2:在webbrowser1上成功登录后需要取另外几个网页的数据(都必须以登录状态取);问题描述1:我用同样的方法:在窗口上多画几个webbrowser,第一个成功登录后其他几个加载不同的页面能正确的得到我需要的信息,但是这种方法太慢了,能不能只画一个登录框,然后用idhttp带上webbrowser1的登录状态去取另外几个网页的数据,或者另外几个webbrowser直接读取html 不让他加载图片信息....补充:如果能给我写个实例源码更好,我的邮箱kain-up@qq.com,回答的好的继续追加分数!

参考技术A 不要用IDHTTP控件
用EmbeddedWB控件就行了
如果没有的话去<a href="http://www.delphinbox.com" target="_blank">www.delphinbox.com</a>下载
IDHTTP是按内存流的方式读网页代码,东西多了效率就低
EmbeddedWB是以MSHTML接口读网页代码,可以把读到的代码批量送出
参考技术B 用indy控件,在用webbrowser登陆之后。
ihttp.get(url)
参考技术C 广东韶关

Python中怎样获取一网页上的内容?我想通过python读取网页上的各个不同的单词和分别出现的次数

参考技术A 最简单的办法,不需要任何第三方库,获取网页源代码,进行正则匹配:
import
urllib,re
url
=
"http://www.163.com"
#网页地址
wp
=
urllib.urlopen(url)
#打开连接
content
=
wp.read()
#获取页面内容
m
=
re.match(r"^你的单词$",
content)
len(m)
m就是匹配到所有单词的列表,len(m)就是该单词的个数了
参考技术B 你好
首先,浏览器显示给用户的内容完全是根据html源码来的、所以,你想获取的一切浏览器显示的内容,都是在html文件中存在的内容
统计页面上的单词,必然是要读html源文件的
可以使用urllib2库,以及re库来进行匹配查找,代码如下:
import
urllib2
import
re
word
=
'你想查找的单词'
urlfile
=
urllib2.urlopen('你要打开的网址内容,记住要带上协议前缀,比如http')
#以文件的形式打开一个网页
html
=
urlfile.read()
#从网页文件中读html
wordList
=
re.findall(re.compile(word),
html)
#正则findall
查找所有的单词
print
len(wordList)
#个数re模块记不太清,没试验、试试看,不行再追问

以上是关于怎样用delphi 获取网页html源代码(网页需登录)的主要内容,如果未能解决你的问题,请参考以下文章

delphi 获取网页js返回数据

delphi 网页源代码

请问如何在delphi from窗体内加网页

用delphi获取网页元素(按钮)然后模拟点击 你的这个问题是怎么解决的?麻烦详细的写一下

用Delphi做的管理系统如何连接网页

如何用delphi7在后台登录一个网站并打开一个有权限(登陆用户)的网页?