Requests-数据解析bs4+xpath

打印 上一主题 下一主题

主题 844|帖子 844|积分 2532

原理:定位到对应标签,获取标签内的东西
解析三种方法:
    1:正则

58二手房。获取图片列表,二进制content。睁开,每个图片是一个内容,正则从头取到尾,不同之处用 .*? 更换掉。

  1. import requests
  2. import re
  3. import os
  4. if __name__ == "__main__":
  5.     # url='https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2898385373.jpg'
  6.     # img_data=requests.get(url=url).content
  7.     # with open("./pic.png","wb") as fp:
  8.     #    fp.write(img_data)
  9.     if not os.path.exists("./pictures"):
  10.         os.makedirs("./pictures")
  11.     url='https://www.58.com/ershoufang/'
  12.     #2.进行UA伪装
  13.     headers = {
  14.         'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'
  15.     }
  16.     #
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

八卦阵

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表