java - com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 Not Found for https://tax.ocgov.com/includes/jquery-2.2.3.min.js
问题描述
我正在尝试通过 HtmlUnit 在https://tax.ocgov.com/tcweb/search_page.asp上查找有效的包裹编号,因此我使用了以下 for 循环:
for (Integer pID=34056101; pID<34056111; pID++) {
HtmlPage page = webClient.getPage("https://tax.ocgov.com/tcweb/search_page.asp");
String i = pID.toString();
final HtmlForm form = page.getFormByName("searchparcel");
final HtmlTextInput taxIDInput = form.getInputByName("t_parcel_no");
final HtmlImageInput button = form.getInputByName("s_parcel");
taxIDInput.type(i);
final HtmlPage page2 = (HtmlPage) button.click();
//System.out.println(page2.getUrl().getPath());
if (page2.getUrl().getPath() == "/tcweb/search_parcel.asp")
{writer.println(pID);}
}
但是,我收到了这个错误:
com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException: 404 Not Found for https://tax.ocgov.com/includes/jquery-2.2.3.min.js
异常是由这行代码引起的:
final HtmlPage page2 = (HtmlPage) button.click();
我应该怎么做才能使我的程序正常工作?
解决方案
您正在使用的页面有很多问题 - 只需打开浏览器控制台并自己查看....
开箱即用的 HtmlUnit 是为页面测试而编写的,因此与真实浏览器相比,此类错误的处理更加敏感。但是你可以改变这一点。
对我来说,这段代码有效:
final String url = "https://tax.ocgov.com/tcweb/search_page.asp";
try (final WebClient webClient = new WebClient()) {
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
HtmlPage page = webClient.getPage(url);
webClient.waitForBackgroundJavaScript(1000);
final HtmlForm form = page.getFormByName("searchparcel");
final HtmlTextInput taxIDInput = form.getInputByName("t_parcel_no");
final HtmlImageInput button = form.getInputByName("s_parcel");
taxIDInput.type("34056101");
final HtmlPage page2 = (HtmlPage) button.click();
webClient.waitForBackgroundJavaScript(1000);
System.out.println("***********");
System.out.println(page2.asNormalizedText());
System.out.println("***********");
}
推荐阅读
- python - 我应该如何在 python Kafka 中实现延迟主题架构
- mysql - 来自数据库的分页查询
- android - 如何在服务或接收器中使用没有 XML 和 PreviewView 的 CameraX?
- reactjs - 在本机反应中将GIF设置为文本背景
- python - 在 seaborn 中可视化数据
- python - 无法安装tabletext
- c++ - 如何从protobuf中的枚举中获取下一个枚举值?
- r - 如何创建矩阵的直方图?
- java - Java:如何从外部方法调用整数值
- express - 在 Express/Nginx 上使用带有 ejs 的 socket.io