打印

基于requests的爬虫,0基础,超简单

[复制链接]
458|1
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
1,安装requests,bs4这里假装你安装了最新的Python3了。
cmd,运行
首先安装必要组件:
pip3 install requests
pip3 install beautifulsoup4


网速不给力,就要多试几次。。。。。。。。坑爹不?

安装后,再在Python里就可以正常使用它了。
bs4方法类似

----------------------------------------------

使用特权

评论回复

相关帖子

沙发
gaoyang9992006|  楼主 | 2019-7-23 19:10 | 只看该作者
import requests
from bs4 import BeautifulSoup
url="https://www.163.com/"
wbdata = requests.get(url).text
soup =BeautifulSoup(wbdata,'html.parser')
news_titles = soup.select("div>ul>li>a")
for n in news_titles:
title=n.get_text()
link=n.get("href")
data = {'标题':title,'链接':link}
print(data)
然后运行,效果如下

一个最简单的爬虫就搞定了。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

认证:西安公路研究院南京院
简介:主要工作从事监控网络与通信网络设计,以及从事基于嵌入式的通信与控制设备研发。擅长单片机嵌入式系统物联网设备开发,音频功放电路开发。

1954

主题

15896

帖子

207

粉丝