异想天开

What's the true meaning of light, Could you tell me why

似然函数

日期:2016-01-23 16:55:26
  
最后更新日期:2016-01-24 14:00:37
(更详细信息,见wiki)
概率,我们说一件事发生的概率,也就是讲一件事发生的可能性,一件事会发生可能性的大小我们称之为概率。似然,是一件事已经发生,我们推导它发生的概率。比如投硬币两次都是正面朝上,推测一次正面朝上的概率,我们根据一次正面朝上的概率这个变量,去估计两次正面朝上的概率,这个估计的表达式,也就是似然函数,由于两次正面朝上结果已经发生了,我们需要让似然函数越大越好,也就是取最大值。对于似然的概念,为了更好理解,构造下面例子。
题目描述:
你口袋里面有10个球,球的颜色只有两种,黑色和白色。现在你做一个实验,你从口袋摸一个球,记下颜色,然后放回去。这个动作重复三次。你得到了两个白球和一个黑球。那么推测白色球的比例有多少?
解析:
白球的比例,可以认为就是摸一次球是白球的概率,记为θ,由于只有两种球,那么摸黑球的概率就是1-θ。针对三次摸球,2白1黑的似然函数为:
L(P(白) | 2白1黑)
上面竖线左边表示白球的概率,竖线右边表示出现的结果为2白1黑。这个竖线不同于条件概率的竖线。根据摸白球的概率,2白1黑出现的概率,也就是2白1黑似然函数即为:
L(P(白) | 2白1黑) = (1-θ)θ^2
这里的θ取值范围为0到1。为什么在似然函数取最大值的情况下,求解θ。这个其实也没有为什么。只是这件事已经发生了,我们假设了这件事是一个大概率事件。你可能会反驳,假设10个球中,只有2个白球,其余全是黑球。没错,我们的假设是基于摸到2白1黑,在整体的样本空间是一个大概率事件,不然不会那么容易产生这样的结果,你构造的反例只是说明了,我们的样本不够准确,需要多抽取几次才能更好的反应整体。
求解似然函数最大值,就可以交给计算机去做了。不过,这个次数比较小,可以求导,判断几个极值点。但也可以形象地在mathematica软件画出图像如下,可以看到θ在0.7附近取最大值。