Python爬虫项目--批量下载小姐姐壁纸

打印 上一主题 下一主题

主题 886|帖子 886|积分 2658

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐
又到了学Python时刻~
你还在为一个一个下载壁纸而烦恼吗,那有没有更加简单的方法呢?
跟着我,一起来看看我是如何批量下载的吧
环境使用:


  • python3.8 | Anaconda
  • pycharm
相关模块:


  • requests >>> pip install requests
  • parsel
模块安装方法:win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名, 回车
插 件:

xpath helper扩展工具包
安装步骤:先获取xpath helper扩展工具包(注意:不要解压)
》》 打开Google浏览器 --> 更多工具 --> 扩展程序 --> 打开开发者模式 --> 把xpath helper扩展工具包直接拖入 --> 刷新
使用方法:快捷键 ctrl+shift+X
基本思路

1.网页的图片怎么来的?
写代码(爬虫): 网页源代码 浏览器 --> 解析数据
第一页 --> 41页

  • 发送请求
  • 响应数据
  • 解析数据 图片
  • 保存数据
代码
  1. import requests   # 需要下载   知道  1   不知道 2  pip install requests  win+R  --> cmd
  2. import re  # 正则   不需要下载
  3. import parsel  #数据解析  需要下载
复制代码
 
 
 
  1. # 伪装
  2. headers = {
  3.     # 用户代理  浏览器基本的身份信息
  4.     'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
  5. }
  6. # 发送请求  response数据请求状态
  7. response = requests.get(url,headers)
  8. # print  打印输出   <Response [200]> 响应对象   200 状态码  成功
  9. print(response)
  10. """
  11. 2.响应数据    网页源代码
  12. """
  13. # print(response.text)
  14. """
  15. 3.解析数据   图片  re
  16. """
  17. # .*?  精准查找
  18. re_data = re.findall('<a href="https://www.cnblogs.com/(.*?)" target="_blank"rel="bookmark">(.*?)</a>',response.text)
  19. print(re_data)
  20. # for循环
  21. for link,title in re_data:
  22.     # print(link)
  23.     response_1 = requests.get(link, headers).text
  24.         # print(response_1)
  25.     # 解析数据  标签详情页
  26.     selector = parsel.Selector(response_1)
  27.     # css:定位 img_url 图片链接
  28.     img_url = selector.css('.entry-content img::attr(src)').getall()
  29.     # print(img_url)
  30.     for img in img_url:
  31.         print(img)
  32.         img_name = img.split('/')[-1]
  33.         # content  二进制
  34.         content = requests.get(img,headers).content
  35.         """
  36.         4.保存数据
  37.         """
  38.         with open('img\\'+ img_name, mode='wb') as file:
  39.             file.write(content)
复制代码

 
 
 
 







 
 
文章看不懂,我专门录了对应的视频讲解,本文只是大致展示,完整代码和视频教程点击下方蓝字
==点击 蓝色字体 自取,我都放在这里了。==
尾语
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

风雨同行

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表