怎么用pyquery取到第二个p节点。
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么用pyquery取到第二个p节点。相关的知识,希望对你有一定的参考价值。
str1 = """
<p class="txt" node-type="feed_list_content" nick-name="Vista看天下" style="display: none;">lalala</p>
<p class="txt" node-type="feed_list_content_full" nick-name="Vista看天下" style="">bbbbb</p>
"""
我的意思是怎么选到问题描述里的第二个p结点。
参考技术A #导包from pyquery import PyQuery
content = PyQuery("str1")
two_class = content(".class:nth-child(2)") #选取的是第二个class对象
Chrome 节点:无法执行请求:java.net.ConnectException:导航到第二个 URL 后连接被拒绝
【中文标题】Chrome 节点:无法执行请求:java.net.ConnectException:导航到第二个 URL 后连接被拒绝【英文标题】:Chrome node: Unable to execute request: java.net.ConnectException: Connection refused after navigating to second URL 【发布时间】:2021-11-07 18:21:28 【问题描述】:目前在 Ubuntu EC2 上使用 Firefox 和 Chrome 节点运行 Selenium Grid。使用 TestNG 运行测试,通过 Firefox 节点运行的测试可以完美运行,但是使用 Chrome 节点时,我在导航到第二个 URL 后总是被拒绝连接。我感到困惑的是,当通过我的 Mac 在本地运行网格时,一切正常。
以下是 Chrome 测试的方式:
获取登录页面 URL 登录 尝试获取新页面 URL 连接被拒绝以前有没有遇到过这个问题?对于类似的报告问题,我尝试了很多解决方案,但无济于事。我对 Selenium Grid 很陌生,所以我发现很难弄清楚发生了什么。
我的撰写文件:
version: "3"
services:
chrome:
image: selenium/node-chrome:4.0.0-rc-2-prerelease-20210908
shm_size: 2gb
volumes:
/dev/shm:/dev/shm
environment:
SE_EVENT_BUS_HOST=selenium-hub
SE_EVENT_BUS_PUBLISH_PORT=4442
SE_EVENT_BUS_SUBSCRIBE_PORT=4443
SE_NODE_SESSION_TIMEOUT=10
SE_SESSION_REQUEST_TIMEOUT=60
JAVA_OPTS=-Dwebdriver.chrome.whitelistedIps=
START_XVFB=false
ports:
"6900:5900"
firefox:
image: selenium/node-firefox:4.0.0-rc-2-prerelease-20210908
shm_size: 2gb
volumes:
/dev/shm:/dev/shm
environment:
SE_EVENT_BUS_HOST=selenium-hub
SE_EVENT_BUS_PUBLISH_PORT=4442
SE_EVENT_BUS_SUBSCRIBE_PORT=4443
SE_NODE_SESSION_TIMEOUT=10
SE_SESSION_REQUEST_TIMEOUT=60
START_XVFB=false
ports:
"6901:5900"
edge:
image: selenium/node-edge:4.0.0-rc-2-prerelease-20210908
shm_size: 2gb
volumes:
/dev/shm:/dev/shm
environment:
SE_EVENT_BUS_HOST=selenium-hub
SE_EVENT_BUS_PUBLISH_PORT=4442
SE_EVENT_BUS_SUBSCRIBE_PORT=4443
SE_NODE_SESSION_TIMEOUT=10
SE_SESSION_REQUEST_TIMEOUT=60
START_XVFB=false
ports:
"6902:5900"
selenium-hub:
image: selenium/hub:4.0.0-rc-2-prerelease-20210908
container_name: selenium-hub
ports:
"4442:4442"
"4443:4443"
"4444:4444"
depends_on:
chrome
edge
firefox
我的 ChromeDriver 设置:
WebDriverManager.chromedriver().setup();
// chrome browser prefrences
HashMap<String, Object> prefs = new HashMap<>();
prefs.put("profile.default_content_settings.popups", 0);
prefs.put("download.prompt_for_download", false);
prefs.put("safebrowsing.enabled", false);
prefs.put("download.extensions_to_open", "application/xml");
prefs.put("download.extensions_to_open", "application/csv");
prefs.put("download.extensions_to_open", "application/pdf");
prefs.put("download.extensions_to_open", "application/zip");
// set chrome options
ChromeOptions chromeOptions = new ChromeOptions();
chromeOptions.setExperimentalOption("prefs", prefs);
chromeOptions.addArguments("--start-fullscreen");
chromeOptions.addArguments("--safebrowsing-disable-download-protection");
chromeOptions.addArguments("--no-sandbox");
chromeOptions.addArguments("--disable-gpu");
chromeOptions.addArguments ("--disable-setuid-sandbox");
chromeOptions.addArguments ("--no-first-run");
chromeOptions.addArguments ("--safebrowsing-disable-auto-update ");
chromeOptions.addArguments ("--disable-background-networking");
chromeOptions.addArguments("--headless", "--enable-logging", "--window-size=1920x1080");
// start remote session
driver = new RemoteWebDriver(new URL("http://localhost:4444/"),chromeOptions);
selenium/node-chrome 日志:
启动 ChromeDriver 93.0.4577.15 (660fc11082ba57405eca2e8c49c3e1af756fbfae-refs/branch-heads/4577@#203) 在端口 22087 上允许所有远程连接。使用许可名单 反而!请参见 https://chromedriver.chromium.org/security-considerations 为 有关保持 ChromeDriver 安全的建议。 ChromeDriver 已启动 成功地。 16:48:54.257 信息 [ProtocolHandshake.createSession] - 检测到的方言:W3C 启动 ChromeDriver 93.0.4577.15 (660fc11082ba57405eca2e8c49c3e1af756fbfae-refs/branch-heads/4577@#203) 在端口 6601 上允许所有远程连接。使用许可名单 反而!请参见 https://chromedriver.chromium.org/security-considerations 为 有关保持 ChromeDriver 安全的建议。 ChromeDriver 已启动 成功地。 16:49:13.576 信息 [ProtocolHandshake.createSession] - 检测到的方言:W3C 16:49:32.070 WARN [SpanWrappedHttpHandler.execute] - 无法执行请求: java.net.ConnectException:连接被拒绝: localhost/127.0.0.1:6601 java.io.UncheckedIOException: java.net.ConnectException:连接被拒绝: 本地主机/127.0.0.1:6601 在 org.openqa.selenium.remote.http.netty.NettyHttpHandler.makeCall(NettyHttpHandler.java:80) 在 org.openqa.selenium.remote.http.AddSeleniumUserAgent.lambda$apply$0(AddSeleniumUserAgent.java:42) 在 org.openqa.selenium.remote.http.Filter.lambda$andFinally$1(Filter.java:56) 在 org.openqa.selenium.remote.http.netty.NettyHttpHandler.execute(NettyHttpHandler.java:51) 在 org.openqa.selenium.remote.http.AddSeleniumUserAgent.lambda$apply$0(AddSeleniumUserAgent.java:42) 在 org.openqa.selenium.remote.http.Filter.lambda$andFinally$1(Filter.java:56) 在 org.openqa.selenium.remote.http.netty.NettyClient.execute(NettyClient.java:119) 在 org.openqa.selenium.remote.tracing.TracedHttpClient.execute(TracedHttpClient.java:55) 在 org.openqa.selenium.grid.web.ReverseProxyHandler.execute(ReverseProxyHandler.java:100) 在 org.openqa.selenium.grid.node.ProtocolConvertingSession.execute(ProtocolConvertingSession.java:75) 在 org.openqa.selenium.grid.node.local.SessionSlot.execute(SessionSlot.java:123) 在 org.openqa.selenium.grid.node.local.LocalNode.executeWebDriverCommand(LocalNode.java:388) 在 org.openqa.selenium.grid.node.ForwardWebDriverCommand.execute(ForwardWebDriverCommand.java:35) 在 org.openqa.selenium.remote.http.Route$PredicatedRoute.handle(Route.java:373) 在 org.openqa.selenium.remote.http.Route.execute(Route.java:68) 在 org.openqa.selenium.remote.tracing.SpanWrappedHttpHandler.execute(SpanWrappedHttpHandler.java:86) 在 org.openqa.selenium.remote.http.Filter$1.execute(Filter.java:64) 在 org.openqa.selenium.remote.http.Route$CombinedRoute.handle(Route.java:336) 在 org.openqa.selenium.remote.http.Route.execute(Route.java:68) 在 org.openqa.selenium.grid.node.Node.execute(Node.java:240) 在 org.openqa.selenium.remote.http.Route$CombinedRoute.handle(Route.java:336) 在 org.openqa.selenium.remote.http.Route.execute(Route.java:68) 在 org.openqa.selenium.remote.AddWebDriverSpecHeaders.lambda$apply$0(AddWebDriverSpecHeaders.java:35) 在 org.openqa.selenium.remote.ErrorFilter.lambda$apply$0(ErrorFilter.java:44) 在 org.openqa.selenium.remote.http.Filter$1.execute(Filter.java:64) 在 org.openqa.selenium.remote.ErrorFilter.lambda$apply$0(ErrorFilter.java:44) 在 org.openqa.selenium.remote.http.Filter$1.execute(Filter.java:64) 在 org.openqa.selenium.netty.server.SeleniumHandler.lambda$channelRead0$0(SeleniumHandler.java:44) 在 java.base/java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:515) 在 java.base/java.util.concurrent.FutureTask.run(FutureTask.java:264) 在 java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128) 在 java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628) 在 java.base/java.lang.Thread.run(Thread.java:829) 引起: java.net.ConnectException:连接被拒绝: 本地主机/127.0.0.1:6601 在 org.asynchttpclient.netty.channel.NettyConnectListener.onFailure(NettyConnectListener.java:179) 在 org.asynchttpclient.netty.channel.NettyChannelConnector$1.onFailure(NettyChannelConnector.java:108) 在 org.asynchttpclient.netty.SimpleChannelFutureListener.operationComplete(SimpleChannelFutureListener.java:28) 在 org.asynchttpclient.netty.SimpleChannelFutureListener.operationComplete(SimpleChannelFutureListener.java:20) 在 io.netty.util.concurrent.DefaultPromise.notifyListener0(DefaultPromise.java:578) 在 io.netty.util.concurrent.DefaultPromise.notifyListeners0(DefaultPromise.java:571) 在 io.netty.util.concurrent.DefaultPromise.notifyListenersNow(DefaultPromise.java:550) 在 io.netty.util.concurrent.DefaultPromise.notifyListeners(DefaultPromise.java:491) 在 io.netty.util.concurrent.DefaultPromise.setValue0(DefaultPromise.java:616) 在 io.netty.util.concurrent.DefaultPromise.setFailure0(DefaultPromise.java:609) 在 io.netty.util.concurrent.DefaultPromise.tryFailure(DefaultPromise.java:117) 在 io.netty.channel.nio.AbstractNioChannel$AbstractNioUnsafe.fulfillConnectPromise(AbstractNioChannel.java:321) 在 io.netty.channel.nio.AbstractNioChannel$AbstractNioUnsafe.finishConnect(AbstractNioChannel.java:337) 在 io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:707) 在 io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:655) 在 io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:581) 在 io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:493) 在 io.netty.util.concurrent.SingleThreadEventExecutor$4.run(SingleThreadEventExecutor.java:986) 在 io.netty.util.internal.ThreadExecutorMap$2.run(ThreadExecutorMap.java:74) 在 io.netty.util.concurrent.FastThreadLocalRunnable.run(FastThreadLocalRunnable.java:30)
【问题讨论】:
【参考方案1】:修复了这些 chrome 参数:
chromeOptions.addArguments("--safebrowsing-disable-auto-update ");
chromeOptions.addArguments("--disable-background-networking");
chromeOptions.addArguments("--no-proxy-server");
chromeOptions.addArguments("--no-sandbox");
chromeOptions.addArguments("--disable-extensions");
chromeOptions.addArguments("--dns-prefetch-disable");
chromeOptions.addArguments("--disable-gpu");
chromeOptions.addArguments("--force-device-scale-factor=1");
chromeOptions.setPageLoadStrategy(PageLoadStrategy.EAGER);
【讨论】:
以上是关于怎么用pyquery取到第二个p节点。的主要内容,如果未能解决你的问题,请参考以下文章
Chrome 节点:无法执行请求:java.net.ConnectException:导航到第二个 URL 后连接被拒绝
DB2数据库中一个字符串 '111,222,333,444',如何取第二个或者第三个,的位置?有没有函数?
python+selenium 两个同样的class怎么定位到第二个
quartz有两个定时任务,当第二个影响到第一个时,怎么处理