如何在 Python 函数中执行 QWebEngine

Posted

技术标签:

【中文标题】如何在 Python 函数中执行 QWebEngine【英文标题】:How to execute QWebEngine in Python function 【发布时间】:2019-06-17 08:25:14 【问题描述】:

我有一个 QWebEngine 类来读取网页并为它们创建 BeautifulSoup。

代码如下:

import sys
from bs4 import BeautifulSoup
import os


from PyQt5 import QtCore, QtWidgets, QtWebEngineWidgets


class WebPage(QtWebEngineWidgets.QWebEnginePage):
    def __init__(self):
        super(WebPage, self).__init__()
        self.loadFinished.connect(self.handleLoadFinished)
        self.soup = []

    def start(self, urls):
        self._urls = iter(urls)
        self.fetchNext()

    def fetchNext(self):
        try:
            url = next(self._urls)
        except StopIteration:
            return False
        else:
            self.load(QtCore.QUrl(url))
        return True

    def processCurrentPage(self, html):
        url = self.url().toString()
        self.soup.append(BeautifulSoup(html, 'lxml'))
        if not self.fetchNext():
            QtWidgets.qApp.quit()

    def handleLoadFinished(self):
        self.toHtml(self.processCurrentPage)

这是另一个调用WebPage类的函数:

def get_soup(urls):
    app = QtWidgets.QApplication(sys.argv)
    webpage = WebPage()
    webpage.start(urls)
    return webpage.soup

这里是main

if __name__ == "__main__":

    urls = ["http://www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh", "http://www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sz"]      
    soups = get_soup(urls)

但是,当我执行程序时,程序会重新启动。

应该改变什么?

【问题讨论】:

【参考方案1】:

这是我已经遇到的问题,分析我发现 QApplication 在 QWebEnginePage 使 QWebEngineProfile 被删除之前被破坏,在这种情况下导致 QWebEnginePage 崩溃。解决方案是通过将其设置为全局变量来使应用程序具有更大的范围。

另一方面,您必须调用 exec_() 以便允许信号操作的事件循环

# ...
app = None

def get_soup(urls):
    global app
    app = QtWidgets.QApplication(sys.argv)
    webpage = WebPage()
    webpage.start(urls)
    app.exec_()
    return webpage.soup
# ...

注意:与此问题相关的 QTBUG-75547 似乎已在 Qt5>=5.12.4 中得到解决,因此可能在 PyQtWebEngine 的下一个版本中将不再观察到该错误.

【讨论】:

以上是关于如何在 Python 函数中执行 QWebEngine的主要内容,如果未能解决你的问题,请参考以下文章

如何在python中执行逻辑套索?

在Python中定义Main函数

如何计算python函数的执行时间? [复制]

如何从外部调用的 Python 函数在 Qlabel 中显示消息

python selenium如何仅在函数可用时执行_script

如何捕获 CTRL+C 并在 python 的主函数中执行条件? [复制]