【R语言编程绘图-mlbench】

[复制链接]
发表于 2025-6-27 10:32:18 | 显示全部楼层 |阅读模式
mlbench库简介

mlbench是一个用于机器学习的R语言扩展包,重要用于提供经典的基准数据集和工具,常用于算法测试、教学演示或研究场景。该库包含多个知名数据集,涵盖分类、回归、聚类等使命。
包含的重要数据集


  • BostonHousing
    波士顿房价数据集,包含506条记录和14个特征,用于回归使命。目的变量为房屋中位数价格。
  • BreastCancer
    威斯康星州乳腺癌数据集(原始版),包含699个样本和10个特征,用于二分类使命(良性/恶性)。
  • DNA
    人工合成的DNA序列分类数据集,包含3186条序列,用于多分类使命(3个种别)。
  • Glass
    玻璃化学成分数据集,包含214个样本和10个特征,用于多分类使命(6种玻璃类型)。
  • Ionosphere
    电离层雷达信号数据集,包含351个样本和34个特征,用于二分类使命(信号是否显示结构)。
  • PimaIndiansDiabetes
    皮马印第安人糖尿病数据集,包含768个样本和8个特征,用于二分类使命(是否患糖尿病)。
  • Satellite
    遥感卫星图像数据集,包含6435个样本和36个特征,用于多分类使命(6种土地类型)。
  • Sonar
    声纳信号数据集,包含208个样本和60个特征,用于二分类使命(金属/岩石目的)。
  • Vehicle
    车辆表面数据集,包含846个样本和18个特征,用于多分类使命(4种车辆类型)。
安装与调用方法

在R中安装并加载mlbench:
  1. install.packages("mlbench")
  2. library(mlbench)
复制代码
加载数据集示例(以BostonHousing为例):
  1. data(BostonHousing)
  2. head(BostonHousing)
复制代码
特点与用途



  • 数据集颠末标准化处理,可直接用于建模。
  • 涵盖多种使命类型,得当算法对比实行。
  • 部门数据集包含缺失值,需预处理(如PimaIndiansDiabetes)。
留意:mlbench的数据集通常较小,得当快速验证模子,不实用于大规模训练场景。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

×
登录参与点评抽奖,加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表