BeautifulSoup庫的作用如下:
BeautifulSoup是python的壹個庫,其提供壹些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是壹個工具箱,通過解析文檔為用戶提供需要抓取的數據,因為簡單,所以不需要多少代碼就可以寫出壹個完整的應用程序。BeautifulSoup4和lxml壹樣,BeautifulSoup也是壹個HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML數據。
BeautifulSoup庫的特點
BeautifulSoup庫是靈活又方便的網頁解析庫,處理高效,支持多種解析器。利用它不用編寫正則表達式即可方便地實現網頁信息的提取。prettify()方法可以將代碼格式搞的標準壹些,用soup.prettify()表示。在PyCharm中,用print(soup.prettify())來輸出。
BeautifulSoup支持Python標準庫中的HTML解析器,還支持壹些第三方的解析器,如果我們不安裝它,則Python會使用Python默認的解析器,lxml解析器更加強大,速度更快,推薦使用lxml解析器。