vb怎么获取网页中的每个元素内容

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了vb怎么获取网页中的每个元素内容相关的知识,希望对你有一定的参考价值。

参考技术A 如果这个元素有:ID,Name或TagName,那就最简单不过,
GetElementByID或相应的函数就能得到,得到之后,你需要用这个元素的Innerhtml属性等来获取该元素的内容。
如果这个元素没有对应的能直接找到它的ID等,你就需要根据它的类型,比较准确的不变的内容来判断是不是你要的元素,这需要配合VB的TypeName函数或元素的ClassName属性,以及InnerHtml或InnerText等属性来判断,你可以遍历网页的所有元素来查找,哪个是你需要的元素,然后在对其操作。
如果你还不明白,把你的问题具体写出来,网页内容你需要处理的部分写出来,然后你用什么类或控件来处理网页内容,这都需要写出来,我们才能帮你,而且这不是个简单的问题。需要很复杂的过程。所以,你把你的需求和环境写的越明白,我能帮到你的地方就越多。

QT打开一个网页,并获取网页内容,该怎么处理

获取内页内容最直接的办法就是选择要复制的内容,右击鼠标复制,或者CTRL+C复制,ctrl+v粘贴即可。

对于此方法无法复制的网页内容可以通过在浏览器右上角的工具-查看源代码,


把该文字的第一句用CTRL+F查找这段文字,

把记住你要复制文字的开头和结尾,选择后网页文字和代码一起复制,

再通过一个HTML编程器进行转换,像这里就是HTML的编辑器,或者在网站后台发布文章的位置点击源码,


这时候其他图标都变成灰色。

复制刚刚的文字,然后再粘贴,

这时候有代码,请再点击一下源码,切换回来刚刚的状态

文字变成正常网页显示的内容,再复制粘贴即可。

参考技术A

获取网页源码的小例子,代码很简单,就不多作解释了。

不过一定要注意网页的编码问题,否则会出现乱码的!!!

[cpp] view plain copy print?
#include <QtCore>      
#include <QtNetwork>      
    
//网页地址      
const QString URLSTR = "http://www.csdn.net/";      
//储存网页代码的文件      
const QString FILE_NAME = "code.html";      
    
int main(int argc, char **argv)      
      
    QCoreApplication app(argc, argv);      
    QUrl url(URLSTR);      
    QNetworkAccessManager manager;      
    QEventLoop loop;      
    QTextCodec *codec;    
    QNetworkReply *reply;    
    
    qDebug() << "Reading html code form " << URLSTR;      
    reply = manager.get(QNetworkRequest(url));      
    //请求结束并下载完成后,退出子事件循环      
    QObject::connect(reply, SIGNAL(finished()), &loop, SLOT(quit()));      
    //开启子事件循环      
    loop.exec();      
    
    //获取源码,打开文件  
    QFile file(FILE_NAME);    
    if( !file.open(QIODevice::WriteOnly | QIODevice::Text) )  
      
        qDebug() << "Cannot open the file: " << FILE_NAME;  
        return 0;  
      
    QTextStream out(&file);    
    QString codeContent = reply->readAll();    
  
    //将获取到的网页源码写入文件  
    //一定要注意编码问题,否则很容易出现乱码的  
    codec = QTextCodec::codecForHtml(codeContent.toAscii());    
    codeContent = codec->toUnicode(codeContent.toAscii());    
    out.setCodec(codec);  
    out << codeContent << endl;    
    file.close();    
    qDebug() << "Finished, the code have written to " << FILE_NAME;      
    return 0;      

参考技术B

是从网页上获取内容吗?是获取全部还是获取指定数据?

获取全部的话用网络编程的IO估计就可以处理,获取指定数据的话我只用过jsoup。

参考技术C 这个,可以看看
源码

以上是关于vb怎么获取网页中的每个元素内容的主要内容,如果未能解决你的问题,请参考以下文章

vb 获取一个网页内的链接和链接名称

用Excel中的vba获取网页内容填写网页表单

VB如何获取网页的内容

Angularjs中$http.post返回的网页怎么获取某个元素的内容

怎么用 vb提取网页内容?

VB如何获取网页动态数据