马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
使用场景:
必要获取货币编码,并初始化到数据库。
解决方案:
- import requests
- from bs4 import BeautifulSoup
- import pandas as pd
- # 目标网页URL
- url = 'http://www.cnhuilv.com/currency/'
- # 发送HTTP请求获取网页内容
- response = requests.get(url)
- # 根据网页的编码调整
- response.encoding = 'utf-8'
- # 使用BeautifulSoup解析HTML
- soup = BeautifulSoup(response.text, 'html.parser')
- # 获取div标签数据,需要指定class名称
- tbodyData = soup.find('div', class_='table-responsive rb1')
- # 初始化数据列表
- data = []
- # 提取表格中的数据
- for row in tbodyData.find_all('tr')[1:]: # 跳过表头
- columns = row.find_all('td')
- if len(columns) > 1:
- if columns[3].text.strip() != '':
- country_name = columns[3].text.strip()
- numerical_code = columns[1].text.strip()
- currency_code = columns[0].text.strip()
- currency_name = columns[2].text.strip()
- data.append({
- '国家名称': country_name,
- '数字代码': numerical_code,
- '货币代码': currency_code,
- '货币名称': currency_name
- })
- # 打印提取的数据
- for item in data:
- print(item)
- # 将数据转换为DataFrame
- df = pd.DataFrame(data)
- # 导出到Excel文件
- output_path = 'C:\\Users\\Administrator\\Desktop\\货币1.xlsx'
- df.to_excel(output_path, index=False)
复制代码 技巧:将html文件保存到本地,使用VScode打开,可以更清晰分析数据所在的标签。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |