selenium是壹個chrome瀏覽器為核心的WEB測試框架,以前也有類似的其它框架。妳甚至可以用pyqt自己開發壹套也不是不成。
妳可以先安裝selenium ide熟悉壹下它的使用方式。 然後妳找壹個教程。這裏就不給URL裏了。
按它的說明在linux下安裝好selenium,記住驅動的版本要與妳的chrome版本完全壹致。這個是因為它們背後用的qt庫如果不壹致,就沒有辦法接起來。
然後試試下面的代碼。
#coding:utf-8from?selenium?import?webdriver
driver=webdriver.Chrome()
driver.get('
)
print?driver.title
driver.quit()
應該可以打印出 網站的名稱。 這就對了。 詳細的內容,可以慢慢看教程。也可以直接看selenium的源代碼。裏面有完整的接口。
另外妳還需要知道壹些瀏覽器的JS知識,還有DOM的知識。HTML的知識當然也必不可少。
如果僅僅是判斷404,可能用不著selenium, 妳直接用urllib.urlopen(url),判斷返回的響應中的status code就可以了。略略看壹下python關於urllib的幫助就可以了。
學習也是壹個工作,摸索找到妳的答案同樣也很重要的壹個工作。