1. 监督学习(Supervised Learning)
训练数据有 输入(特性) 和 精确的输出(标签),模型通过学习映射关系来进行推测。
典范任务:
分类(Classification):辨认邮件是否为垃圾邮件(Spam/Not Spam)。
回归(Regression):推测房价。
常见算法:
线性回归(Linear Regression)
逻辑回归(Logistic Regression)
决议树(Decision Tree)
支持向量机(SVM)
随机森林(Random Forest)
神经网络(Neural Networks)
2. 无监督学习(Unsupervised Learning)
训练数据只有 输入(特性),没有标签,算法通过分析数据结构进行模式发现。
典范任务:
聚类(Clustering):把顾客按购买行为分成不同种别。
降维(Dimensionality Reduction):用 PCA(主成分分析)减少数据维度,提高盘算效率。
常见算法:
K-Means 聚类
条理聚类(Hierarchical Clustering)
主成分分析(PCA)
自编码器(Autoencoder)
3. 强化学习(Reinforcement Learning, RL)
通过 试错(Trial & Error) 进行学习,智能体(Agent)与环境交互,并基于奖励或处罚调整策略,以实现目标最大化。
典范任务:
游戏 AI(如 AlphaGo)
主动驾驶
呆板人控制
关键概念:
状态(State):环境的当前环境
动作(Action):智能体可以做的决议
奖励(Reward):智能体的反馈信号,鼓励好的行为
代表算法:
深度 Q 网络(DQN)
近端策略优化(PPO)
深度确定性策略梯度(DDPG)
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |