vb怎么获取网页中的每个元素内容
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了vb怎么获取网页中的每个元素内容相关的知识,希望对你有一定的参考价值。
参考技术A 如果这个元素有:ID,Name或TagName,那就最简单不过,GetElementByID或相应的函数就能得到,得到之后,你需要用这个元素的Innerhtml属性等来获取该元素的内容。
如果这个元素没有对应的能直接找到它的ID等,你就需要根据它的类型,比较准确的不变的内容来判断是不是你要的元素,这需要配合VB的TypeName函数或元素的ClassName属性,以及InnerHtml或InnerText等属性来判断,你可以遍历网页的所有元素来查找,哪个是你需要的元素,然后在对其操作。
如果你还不明白,把你的问题具体写出来,网页内容你需要处理的部分写出来,然后你用什么类或控件来处理网页内容,这都需要写出来,我们才能帮你,而且这不是个简单的问题。需要很复杂的过程。所以,你把你的需求和环境写的越明白,我能帮到你的地方就越多。
QT打开一个网页,并获取网页内容,该怎么处理
获取内页内容最直接的办法就是选择要复制的内容,右击鼠标复制,或者CTRL+C复制,ctrl+v粘贴即可。
对于此方法无法复制的网页内容可以通过在浏览器右上角的工具-查看源代码,
把该文字的第一句用CTRL+F查找这段文字,
把记住你要复制文字的开头和结尾,选择后网页文字和代码一起复制,
再通过一个HTML编程器进行转换,像这里就是HTML的编辑器,或者在网站后台发布文章的位置点击源码,
这时候其他图标都变成灰色。
复制刚刚的文字,然后再粘贴,
这时候有代码,请再点击一下源码,切换回来刚刚的状态
文字变成正常网页显示的内容,再复制粘贴即可。
参考技术A获取网页源码的小例子,代码很简单,就不多作解释了。
不过一定要注意网页的编码问题,否则会出现乱码的!!!
[cpp] view plain copy print?#include <QtCore>
#include <QtNetwork>
//网页地址
const QString URLSTR = "http://www.csdn.net/";
//储存网页代码的文件
const QString FILE_NAME = "code.html";
int main(int argc, char **argv)
QCoreApplication app(argc, argv);
QUrl url(URLSTR);
QNetworkAccessManager manager;
QEventLoop loop;
QTextCodec *codec;
QNetworkReply *reply;
qDebug() << "Reading html code form " << URLSTR;
reply = manager.get(QNetworkRequest(url));
//请求结束并下载完成后,退出子事件循环
QObject::connect(reply, SIGNAL(finished()), &loop, SLOT(quit()));
//开启子事件循环
loop.exec();
//获取源码,打开文件
QFile file(FILE_NAME);
if( !file.open(QIODevice::WriteOnly | QIODevice::Text) )
qDebug() << "Cannot open the file: " << FILE_NAME;
return 0;
QTextStream out(&file);
QString codeContent = reply->readAll();
//将获取到的网页源码写入文件
//一定要注意编码问题,否则很容易出现乱码的
codec = QTextCodec::codecForHtml(codeContent.toAscii());
codeContent = codec->toUnicode(codeContent.toAscii());
out.setCodec(codec);
out << codeContent << endl;
file.close();
qDebug() << "Finished, the code have written to " << FILE_NAME;
return 0;
参考技术B
是从网页上获取内容吗?是获取全部还是获取指定数据?
获取全部的话用网络编程的IO估计就可以处理,获取指定数据的话我只用过jsoup。
参考技术C 这个,可以看看源码
以上是关于vb怎么获取网页中的每个元素内容的主要内容,如果未能解决你的问题,请参考以下文章