Python爬虫:获取国家货币编码、货币名称

打印 上一主题 下一主题

主题 1685|帖子 1685|积分 5055

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
使用场景:

必要获取货币编码,并初始化到数据库。
解决方案:

  1. import requests
  2. from bs4 import BeautifulSoup
  3. import pandas as pd
  4. # 目标网页URL
  5. url = 'http://www.cnhuilv.com/currency/'
  6. # 发送HTTP请求获取网页内容
  7. response = requests.get(url)
  8. # 根据网页的编码调整
  9. response.encoding = 'utf-8'
  10. # 使用BeautifulSoup解析HTML
  11. soup = BeautifulSoup(response.text, 'html.parser')
  12. # 获取div标签数据,需要指定class名称
  13. tbodyData = soup.find('div', class_='table-responsive rb1')
  14. # 初始化数据列表
  15. data = []
  16. # 提取表格中的数据
  17. for row in tbodyData.find_all('tr')[1:]:  # 跳过表头
  18.     columns = row.find_all('td')
  19.     if len(columns) > 1:
  20.         if columns[3].text.strip() != '':
  21.             country_name = columns[3].text.strip()
  22.             numerical_code = columns[1].text.strip()
  23.             currency_code = columns[0].text.strip()
  24.             currency_name = columns[2].text.strip()
  25.             data.append({
  26.                 '国家名称': country_name,
  27.                 '数字代码': numerical_code,
  28.                 '货币代码': currency_code,
  29.                 '货币名称': currency_name
  30.             })
  31. # 打印提取的数据
  32. for item in data:
  33.     print(item)
  34. # 将数据转换为DataFrame
  35. df = pd.DataFrame(data)
  36. # 导出到Excel文件
  37. output_path = 'C:\\Users\\Administrator\\Desktop\\货币1.xlsx'
  38. df.to_excel(output_path, index=False)
复制代码
技巧:将html文件保存到本地,使用VScode打开,可以更清晰分析数据所在的标签。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

美丽的神话

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表