1. 连续学习与深度学习
1.1 深度学习的范围
深度学习留意“瞬时学习”,如ChatGPT虽在语言方面结果明显,但学习过程会合于前期练习,之后便固定下来,正常使用中不再学习。反向传播算法虽带来非线性学习本事,但为学习非线性映射而捐躯了连续学习本事,且深度学习过于关注已能做到的事,忽略了自身的范围性。
1.2 连续学习的界说
连续学习即体系可以或许连续地从环境中学习,而非像深度学习那样在特定阶段学习后就克制。它意味着模子能不绝顺应新环境,连续提拔自身本事,这与人类在一样平常生存中的学习模式相似,应成为人工智能发展的关键方向。
2. 目的与心智
2.1 夸奖假说
Sutton信赖夸奖假说,以为全部目的寻求都可明白为最大化一个外部吸收的标量信号(夸奖)。为实现总体目的,人们会设置许多子题目,如拿起茶杯不洒出等,复杂的高条理目的如得到博士学位等也是为了优化这个根本夸奖。
2.2 心智的构成
能规划且通过试错学习,并创建天下模子以用于规划,就是Sutton所以为的“心智”。到2030年有四分之一的大概性、2040年有二分之一的大概性人类将明白
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金 |