如何在 Python 函数中执行 QWebEngine
Posted
技术标签:
【中文标题】如何在 Python 函数中执行 QWebEngine【英文标题】:How to execute QWebEngine in Python function 【发布时间】:2019-06-17 08:25:14 【问题描述】:我有一个 QWebEngine 类来读取网页并为它们创建 BeautifulSoup。
代码如下:
import sys
from bs4 import BeautifulSoup
import os
from PyQt5 import QtCore, QtWidgets, QtWebEngineWidgets
class WebPage(QtWebEngineWidgets.QWebEnginePage):
def __init__(self):
super(WebPage, self).__init__()
self.loadFinished.connect(self.handleLoadFinished)
self.soup = []
def start(self, urls):
self._urls = iter(urls)
self.fetchNext()
def fetchNext(self):
try:
url = next(self._urls)
except StopIteration:
return False
else:
self.load(QtCore.QUrl(url))
return True
def processCurrentPage(self, html):
url = self.url().toString()
self.soup.append(BeautifulSoup(html, 'lxml'))
if not self.fetchNext():
QtWidgets.qApp.quit()
def handleLoadFinished(self):
self.toHtml(self.processCurrentPage)
这是另一个调用WebPage
类的函数:
def get_soup(urls):
app = QtWidgets.QApplication(sys.argv)
webpage = WebPage()
webpage.start(urls)
return webpage.soup
这里是main
:
if __name__ == "__main__":
urls = ["http://www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh", "http://www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sz"]
soups = get_soup(urls)
但是,当我执行程序时,程序会重新启动。
应该改变什么?
【问题讨论】:
【参考方案1】:这是我已经遇到的问题,分析我发现 QApplication 在 QWebEnginePage 使 QWebEngineProfile 被删除之前被破坏,在这种情况下导致 QWebEnginePage 崩溃。解决方案是通过将其设置为全局变量来使应用程序具有更大的范围。
另一方面,您必须调用 exec_() 以便允许信号操作的事件循环
# ...
app = None
def get_soup(urls):
global app
app = QtWidgets.QApplication(sys.argv)
webpage = WebPage()
webpage.start(urls)
app.exec_()
return webpage.soup
# ...
注意:与此问题相关的 QTBUG-75547 似乎已在 Qt5>=5.12.4 中得到解决,因此可能在 PyQtWebEngine 的下一个版本中将不再观察到该错误.
【讨论】:
以上是关于如何在 Python 函数中执行 QWebEngine的主要内容,如果未能解决你的问题,请参考以下文章
如何从外部调用的 Python 函数在 Qlabel 中显示消息