Python爬虫(我怎么知道标题写啥嘛)
python爬虫
操作方法
- 01
首先我们先打开Python 按ctrl+n新建一个文件
- 02
那我们就先导入一些模块吧 要用到的模块有 : 1、requests库 http://blog.csdn.net/shanzhizi/article/details/50903748 2、re 正则表达式 http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
- 03
那我们先让爬虫模拟一个浏览器环境
- 04
然后写个提示 让用户输入要搜索的内容和获取用户输入的内容
- 05
那么要怎么样才能让网站知道我们需要搜索的内容呢(貌似我还没定义URL)
- 06
那么怎么让他显示内容呢,先改下网站的编码格式,,然后再打印输出就行了,可是搜索结果好乱,如果我只要链接怎么办!!!
- 07
只需要链接的话就用BeautifulSoup库,虽然前面没有提到,下载以及使用方法http://cuiqingcai.com/1319.html print(link.get('href'))#输出
- 08
正则表达式???
赞 (0)