马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
内容来源
贝叶斯统计(第二版)中国统计出版社
先验期望准则
对给定的决策题目,若在状态集 Θ \Theta Θ 上有一个正常的先验分布 π ( θ ) \pi(\theta) π(θ)(不是广义先验分布
则收益函数 Q ( θ , α ) Q(\theta,\alpha) Q(θ,α) 对 π ( θ ) \pi(\theta) π(θ) 的期望与方差称为
先验期望收益
Q ( a ) = E θ Q ( θ , a ) Q(a)=E^\theta Q(\theta,a) Q(a)=EθQ(θ,a)
收益的先验方差
V a r [ Q ( θ , a ) ] = E θ [ Q ( θ , a ) ] 2 − [ E θ Q ( θ , a ) ] 2 Var[Q(\theta,a)]=E^\theta[Q(\theta,a)]^2-[E^\theta Q(\theta,a)]^2 Var[Q(θ,a)]=Eθ[Q(θ,a)]2−[EθQ(θ,a)]2
是先验期望收益到达最大的举措 a ′ a' a′
Q ‾ ( a ′ ) = max a ∈ A Q ( a ) \overline{Q}(a')=\max_{a\in A}Q(a) Q(a′)=a∈AmaxQ(a)
称为先验期望准则下的最优举措
若此种最优举措不止一个,其中先验方差到达最小的举措称为二阶矩准则下的最优举措
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |