如果是這樣,采集並不復雜,給妳兩個解決方案:
1、自動動手寫采集:
主要用到的技術就是http通訊和正則。不過自己寫起來需要處理的內容太多,如果只是采集壹個網站的話,可以簡化壹些內容,且采集的數據更加準確或者說更適合自己的應用,因為妳可以控制。http通訊用於獲取網頁源碼,使用正則將需要采集的數據匹配出來。
2、使用工具
當前暫未發現帶有采集規則配置的蜘蛛軟件。壹般蜘蛛軟件就是檢索網頁,采集軟件就是根據指定的規則采集數據。妳應該更適合使用采集軟件。
推薦:soukey采摘,開源的采集軟件,可以根據自己的需求進行控制修改。付費的有網絡礦工,應該是可以滿足妳的要求。