安装bs4时,命令:
pip install beautifulsoup4
安装失败时可以换下面的命令:
pip3 install bs4 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
pip bs4的安装完成后,简单说说这个库的用处。
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间。
简单示例(获取index.html里面的内容):
#!/usr/bin/python
# -*- coding: UTF-8 -*-
from bs4 import BeautifulSoup
soup = BeautifulSoup(open("index.html"),"html.parser")
print(soup)