所在的位置: html >> html介绍 >> HTML解析之BeautifulSoup

HTML解析之BeautifulSoup

BeautifulSoup4简称bs4,是爬虫必学的三方库,它是一个HTML/XML的解析器,主要是解析和提取HTML/XML数据,BeautifulSoup是基于HTMLDOM的,会载入整个文档,解析整个DOM树,而lxml(使用Xpath语法解析网页数据)是局部遍历,因此时间和内存开销都会大很多,所以性能要低于lxml。

官方文档:


转载请注明:http://www.aierlanlan.com/rzfs/859.html