httpunit
HttpUnit模拟按钮点击以及爬虫实现(模拟百度搜索)
HttpUnit本质上相当于一个后台的透明的浏览器引擎,使用HttpUnit可以实现模拟点击按钮,抓取网页元素,实现动态爬虫,之前一直使用jsoup爬虫,不过这次爬取一个生物论坛时候,需要动态处理,发现了httpUnit这个好的框架。
·2018-03-02·5348次浏览