(1) books.htm
计算机
- 数据库
- 程序设计
- 计算机网络
(2) database.htm
数据库
- MySQL数据库
(3) program.htm
程序设计
- Python程序设计
- Java程序设计
(4) network.htm
计算机网络
(5) mysql.htm
MySQL数据库
(6) python.htm
Python程序设计
(7) java.htm
Java程序设计
from bs4 import BeautifulSoup import urllib.request def spider(url): try: data=urllib.request.urlopen(url) data=data.read() data=data.decode() soup=BeautifulSoup(data,"lxml") print(soup.find("h3").text) ____________________________________ for link in links: href=link["href"] ___________________________________ spider(url) except Exception as err: print(err) start_url="http://127.0.0.1:5000" spider(start_url) print("The End") 递归调用
A、links=soup.select("a");url=start_url+href
B、links=soup.select("li");url=start_url+"/"+href
C、links=soup.select("a");url=start_url+"/"+href
D、links=soup.select("li");url=start_url+href