实战01-爬取“猫眼电影Top100”(参考“崔庆才老哥”教程)
ZMK_02
回复
「已注销」: 你好,现在需要滑块验证才能读出html。要么手动滑块验证进去那个页面后,替换代码中的url为进去后的页面url,亲测成功。要么用selenium模拟人的移动,进行滑块验证。最简单的实现如下四步:
btn = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#tcaptcha_drag_thumb"))) //获得按钮
ActionChains(browser).click_and_hold(btn).perform() //长按
ActionChains(browser).move_by_offset(xoffset=180,yoffset=0).perform() // 移动180px,具体值可测试
time.sleep(0.5) //模拟人的速度,稍等待会,防止被发现
ActionChains(browser).release().perform() // 释放
当然还有其它方法进行滑块验证,但涉及的操作较复杂,如图像比对,获得具体移动距离。
|