ToB企服应用市场:ToB评测及商务社交产业平台

标题: 爬虫案例2-爬取视频的三种方式之一:selenium篇(2) [打印本页]

作者: 南飓风    时间: 2024-9-11 18:26
标题: 爬虫案例2-爬取视频的三种方式之一:selenium篇(2)
@
目录

媒介

继利用requests库爬取悦目视频的文章后,本文分享利用python第三方库selenium库接着来爬取视频网站,后续也会接着分享利用第三方库DrissionPage爬取视频。
selenium简介

selenium是一个用于web应用测试的工具集,它可以直接运行在欣赏器中,就像真正的用户在操作一样。它主要应用在主动化测试,web爬虫和主动化任务中。selenium提供了很多编程语言的接口,如java,python,c#等。这让开辟者可以自己编写脚原来主动化web应用的测试。
实战案例

话不多说 ,直接上源码
  1. from selenium import webdriver   # 浏览器驱动
  2. from selenium.webdriver.common.by import By  # 用来定位web页面上的元素
  3. import time             # 时间函数
  4. import os               # 文件管理模块
  5. import requests        # 数据请求模块
  6. if not os.path.exists('./videos1'):  # 创建文件夹
  7.     os.mkdir('./videos1')
  8. def video(data):     # 定义请求每个详细视频的函数
  9.     for url in data:   # 遍历每个详细视频的地址
  10.         driver=webdriver.Chrome()   # 初始化浏览器实例
  11.         driver.get(url)               # 打开url页面
  12.         src=driver.find_element(by=By.CLASS_NAME, value='art-video')  # 获取每个详细视频的详细地址
  13.         src=src.get_attribute('src')
  14.         name=driver.find_element(by=By.CLASS_NAME, value='videoinfo-title')  # 获取每个详细视频的标题
  15.         name=name.text
  16.         video_detail=requests.get(src).content     # 对每个详细视频进行请求
  17.         with open('./videos1/'+name+'.mp4','wb') as f:  # 存储视频
  18.             f.write(video_detail)
  19.         print(name,src)
  20.         driver.quit()        # 关闭浏览器
  21. driver=webdriver.Chrome()     # 初始化浏览器实例
  22. driver.get("https://haokan.baidu.com/")  # 打开网址
  23. for i in range(1,6):
  24.     driver.execute_script("document.documentElement.scrollTop=2000")  # 页面下滑
  25.     time.sleep(1)
  26. time.sleep(2)
  27. data_video=driver.find_elements(by=By.CLASS_NAME,value='videoItem_videoitem__Z_x08') # 对视频信息进行定位
  28. data=[]        # 定义空列表,用来存储每个时评的地址
  29. for a in data_video:  #
  30.     href=a.get_attribute("href")  # 获取视频地址
  31.     data.append(href)
  32. print(data)
  33. time.sleep(2)
  34. driver.quit()   # 关闭浏览器
  35. video(data)   # 调用video()函数
复制代码
共勉

能力决定下限,时机决定上限
博客


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4