超简单获取主域名加备案号脚本(通过获取icp网站爬取) ...

打印 上一主题 下一主题

主题 511|帖子 511|积分 1535

  1. from urllib import request
  2. import sys
  3. from  urllib import  parse
  4. import  re
  5. base_url = "https://www.beianx.cn/search/"
  6. real_url = base_url + parse.quote(sys.argv[1])
  7. print(real_url)
  8. s = request.urlopen(request.Request(real_url)).read().decode('utf-8')
  9. alist = re.findall('<td\s+>\s+\s+<a\starget="_blank" href=[^>]+>(.+)<\/a>',s)
  10. blist = re.findall('<td\s+\s+nowrap="nowrap">\s+(.+)\r\s+<\/td>',s)
  11. print("主域名数量:",len(alist))
  12. for a in alist:
  13.     print(a)
  14. for b in blist:
  15.     print(b)
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

拉不拉稀肚拉稀

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表