具體處理方式就是建立就壹個任務隊列,往隊列裏面插入壹些種子任務和可以開始爬行,爬行的過程就是循環的從隊列裏面提取壹個URL,打開後獲取連接插入隊列中,進行相關的保存。隊列可以使用數組實現。
當然PHP作為但線程的東西,慢慢爬還是可以,怕的就是有的URL打不開,會死在那裏。