基于requests的爬虫,0基础,超简单

[复制链接]
676|1
 楼主| gaoyang9992006 发表于 2019-7-23 19:07 | 显示全部楼层 |阅读模式
1,安装requests,bs4这里假装你安装了最新的Python3了。
cmd,运行
首先安装必要组件:
pip3 install requests
pip3 install beautifulsoup4

796065d36e74716bf4.png
网速不给力,就要多试几次。。。。。。。。坑爹不?
847315d36e7a3a1691.png
安装后,再在Python里就可以正常使用它了。
bs4方法类似
244475d36ea8535acd.png
----------------------------------------------

 楼主| gaoyang9992006 发表于 2019-7-23 19:10 | 显示全部楼层
  1. import requests
  2. from bs4 import BeautifulSoup
  3. url="https://www.163.com/"
  4. wbdata = requests.get(url).text
  5. soup =BeautifulSoup(wbdata,'html.parser')
  6. news_titles = soup.select("div>ul>li>a")
  7. for n in news_titles:
  8. title=n.get_text()
  9. link=n.get("href")
  10. data = {'标题':title,'链接':link}
  11. print(data)
然后运行,效果如下
470795d36eb1e76188.png
一个最简单的爬虫就搞定了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

个人签名:如果你觉得我的分享或者答复还可以,请给我点赞,谢谢。

2052

主题

16403

帖子

222

粉丝
快速回复 在线客服 返回列表 返回顶部