com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 Not Found for https://tax.ocgov.co
Posted
技术标签:
【中文标题】com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 Not Found for https://tax.ocgov.com/includes/jquery-2.2.3.min.js【英文标题】: 【发布时间】:2021-07-12 07:55:16 【问题描述】:我正在尝试通过 htmlUnit 在https://tax.ocgov.com/tcweb/search_page.asp 上查找有效的包裹编号,因此我使用了以下 for 循环:
for (Integer pID=34056101; pID<34056111; pID++)
HtmlPage page = webClient.getPage("https://tax.ocgov.com/tcweb/search_page.asp");
String i = pID.toString();
final HtmlForm form = page.getFormByName("searchparcel");
final HtmlTextInput taxIDInput = form.getInputByName("t_parcel_no");
final HtmlImageInput button = form.getInputByName("s_parcel");
taxIDInput.type(i);
final HtmlPage page2 = (HtmlPage) button.click();
//System.out.println(page2.getUrl().getPath());
if (page2.getUrl().getPath() == "/tcweb/search_parcel.asp")
writer.println(pID);
但是,我收到了这个错误:
com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 不是 找到https://tax.ocgov.com/includes/jquery-2.2.3.min.js
异常是由这行代码引起的:
final HtmlPage page2 = (HtmlPage) button.click();
我应该怎么做才能让我的程序正常运行?
【问题讨论】:
【参考方案1】:您正在使用的页面有很多问题 - 只需打开浏览器控制台并自己查看......
开箱即用的 HtmlUnit 是为页面测试而编写的,因此与真实浏览器相比,此类错误的处理更加敏感。 但是你可以改变它。
对我来说,这段代码有效:
final String url = "https://tax.ocgov.com/tcweb/search_page.asp";
try (final WebClient webClient = new WebClient())
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
HtmlPage page = webClient.getPage(url);
webClient.waitForBackgroundjavascript(1000);
final HtmlForm form = page.getFormByName("searchparcel");
final HtmlTextInput taxIDInput = form.getInputByName("t_parcel_no");
final HtmlImageInput button = form.getInputByName("s_parcel");
taxIDInput.type("34056101");
final HtmlPage page2 = (HtmlPage) button.click();
webClient.waitForBackgroundJavaScript(1000);
System.out.println("***********");
System.out.println(page2.asNormalizedText());
System.out.println("***********");
【讨论】:
这两行代码解决了这个问题:webClient.getOptions().setThrowExceptionOnScriptError(false); webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);非常感谢@RBRi!以上是关于com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 Not Found for https://tax.ocgov.co的主要内容,如果未能解决你的问题,请参考以下文章