女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G... ...

打印 上一主题 下一主题

主题 967|帖子 967|积分 2901

emmm~
起因呢,这昨晚女同桌跟我说电脑有点卡,喊我去宿舍给她装个新系统,装系统就装系统吧,结果又说新系统表情包都没保存~
我当时就有点生气,真当我是万能的呢?
于是我直接就用Python给她爬了几十个G,完事扭头就走,任她怎么喊我也没用!

一、准备工作

使用的环境

  • python3.8 | Anaconda
  • pycharm
使用的模块

  • requests 第三方模块 需要手动安装
  • re 内置模块不需要安装
win+r 输入cmd ,确定后新窗口输入 pip install requests 即可安装成功。
插件安装
xpath helper扩展工具包
安装步骤:找助理老师获取xpath helper扩展工具包(注意:不要解压)
》》 打开Google浏览器  --> 更多工具 --> 扩展程序 --> 打开开发者模式 --> 把xpath helper扩展工具包直接拖入 --> 刷新
使用方法:快捷键 ctrl+shift+X
思路流程
1、分析数据来源
第一页:https://fabiaoqing.com/biaoqing/lists/page/1.html
多页   —> 第一页  --> 一个
2、实现代码

  • 发送请求,第一页数据
  • 获取数据
  • 解析数据,表情
  • 保存数据
二、效果展示

部分效果展示

三、代码解析

1、发送请求
第一页数据
  1. url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
  2. headers = {
  3.     # 键值对  用户代理   浏览器的基本身份
  4.     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
  5. }
  6. response = requests.get(url, headers=headers)
  7. # <Response [200]>  响应对象   200 状态  成功  404  403
  8. print(response)
复制代码
 
2、获取数据
网页源代码
  1. print(response.text)
复制代码
 
re 找规律
3、解析数据
.*? 精准匹配数据
[code]re_data = re.findall('

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

笑看天下无敌手

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表