【呆板学习的重要类型】

何小豆儿在此  金牌会员 | 2025-3-12 19:16:34 | 来自手机 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 976|帖子 976|积分 2928

1. 监督学习(Supervised Learning)

训练数据有 输入(特性) 和 精确的输出(标签),模型通过学习映射关系来进行推测。
典范任务:
分类(Classification):辨认邮件是否为垃圾邮件(Spam/Not Spam)。
回归(Regression):推测房价。
常见算法:
线性回归(Linear Regression)
逻辑回归(Logistic Regression)
决议树(Decision Tree)
支持向量机(SVM)
随机森林(Random Forest)
神经网络(Neural Networks)
2. 无监督学习(Unsupervised Learning)

训练数据只有 输入(特性),没有标签,算法通过分析数据结构进行模式发现。
典范任务:
聚类(Clustering):把顾客按购买行为分成不同种别。
降维(Dimensionality Reduction):用 PCA(主成分分析)减少数据维度,提高盘算效率。
常见算法:
K-Means 聚类
条理聚类(Hierarchical Clustering)
主成分分析(PCA)
自编码器(Autoencoder)
3. 强化学习(Reinforcement Learning, RL)

通过 试错(Trial & Error) 进行学习,智能体(Agent)与环境交互,并基于奖励或处罚调整策略,以实现目标最大化。
典范任务:
游戏 AI(如 AlphaGo)
主动驾驶
呆板人控制
关键概念:
状态(State):环境的当前环境
动作(Action):智能体可以做的决议
奖励(Reward):智能体的反馈信号,鼓励好的行为
代表算法:
深度 Q 网络(DQN)
近端策略优化(PPO)
深度确定性策略梯度(DDPG)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

何小豆儿在此

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表