selenium获取webdriver,并规避反爬

打印 上一主题 下一主题

主题 989|帖子 989|积分 2967

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. #pip install selenium-stealth
  2. from selenium_stealth import stealth
  3. from selenium import webdriver
  4. from webdriver_manager.chrome import ChromeDriverManager
  5. from selenium.webdriver.chrome.service import Service as ChromeService
  6. from selenium.webdriver.chrome.options import Options
  7. def create_selenium_browser(download_path=None):
  8.     # chrome_options = Options()
  9.     # chrome_options.add_argument('--no-sandbox')
  10.     # chrome_options.add_argument('--disable-dev-shm-usage')
  11.     # chrome_options.add_argument('--headless')
  12.     # chrome_options.add_argument("window-size=1920,4080")
  13.     # chrome_options.add_argument('disable-infobars')
  14.     # if download_path:
  15.     #     chrome_options.add_experimental_option("prefs", {
  16.     #     "download.default_directory": download_path,
  17.     #     "download.prompt_for_download": False, # 不弹框
  18.     #     })
  19.     # chrome_options.page_load_strategy = 'eager'
  20.     # browser = webdriver.Chrome(chrome_options=chrome_options)
  21.     user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) ' \
  22.               'Chrome/123.0.0.0 Safari/537.36'
  23.     options = Options()
  24.     options.add_argument('--headless')
  25.     options.add_argument('--no-sandbox')
  26.     options.add_argument('--disable-dev-shm-usage')
  27.     options.add_argument('window-size=1920,4080')
  28.     options.add_argument(f'user-agent={user_agent}')
  29.     options.page_load_strategy = 'eager'
  30.     driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()),options=options)
  31.     # 使用 selenium-stealth 工具,可以动态修改 Selenium 的特征,降低被检测的风险
  32.     stealth(browser,
  33.         languages=["en-US", "en"],
  34.         vendor="Google Inc.",
  35.         platform="Win32",
  36.         webgl_vendor="Intel Inc.",
  37.         renderer="Intel Iris OpenGL Engine",
  38.         fix_hairline=True)   
  39.     return driver
复制代码
以上代码获取到webdriver,并添加selenium-stealth规避反爬。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

九天猎人

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表