此脚本从给定的网页中检索所有链接,并将其保存为txt文件。(文末有完整源码)
这是一个简单的网络爬虫示例,使用了requests库来发送HTTP请求并获取网页内容,使用BeautifulSoup库来解析网页内容。
代码解释如下:
1.导入所需的库导入requests库并将其重命名为rq,用于发送HTTP请求和获取网页内容。
importrequestsasrq
从bs4库导入BeautifulSoup类,用于解析HTML内容。
frombs4importBeautifulSoup2.获取用户输入的链接
提示用户输入一个链接,并将其保存在url变量中。
url=input("EnterLink:").发送HTTP请求获取网页内容
使用条件语句判断用户输入的链接是否以"