学习机器学习前,你首先要掌握这些概率论基础知识

      机器学习中有很多十分重要的核心基础概念,掌握这些概念对我们进行机器学习和数据科学的相关工作十分重要,可以帮助我们发现一些以往容易被忽视的新线索。那么其中很重要的一个就是——概率。

       有的朋友在看见概率的时候可能会问,我们已经有了那么多很好用的数学工具了,为什么还需要概率呢?我们拥有可以解决多种尺度并衡量其变化的微积分;拥有可以借方程做变化的线性代数,还有很多很多的数学工具可以解决几乎我们能想到的所有难题。概率似乎不是那么重要了?

       但事实上,我们生活在一个充满混沌和不确定的世界里,很多事情没办法精确的测量。当我们进行研究的时候,面对的是随机误差和不确定性的干扰。不确定性几乎无处不在,我们需要了解它的习性,掌握并利用它,这就是我们需要概率理论和统计的原因。

       如今概率已经深入到人工智能、粒子物理、社会科学、生物信息科学等方方面面,甚至我们日常生活中的点点滴滴。

       概率和统计的概念如此重要,下面我们就为大家阐述概率相关的不同概率,希望大家可以对概率有更清晰的认识。

频率论概率

       想象一下我们要测量一个硬币是否均匀,需要进行怎样的实验呢?我们需要不断的抛硬币,并记录每一次的朝向,重复1000次后让我们来看看实验的结果。如果结果是600次朝上400 次朝下,那么我们将得到60%和40%的概率。这个概率就可以作为硬币朝上或者朝下的概率,这样的方式成为频率派的概率观点。

条件概率

       频率派的观点需要通过大量实验的记录来总结。但条件概率却是不一样的观点,在事件B发生的情况下A发生的概率。让我们来看两个例子:

我们看到电闪雷鸣的情况下下雨的概率是多少?

艳阳天下雨的概率是多少?

       在上面的欧拉图中我们可以看大P(Rain | Thunder) = 1, 意味着打雷就会下雨(假定100%),但对于 P(Rain | Sunny)呢?虽然这个概率很小,但是我们如何通过一个公式将它表达出来呢?这就引出了条件概率的表达式:

我们通过将同时下雨和出太阳的概率除以出太阳的概率算出了出太阳的情况下会下雨的条件概率。

独立和依赖事件

       如果某一事件发生的概率完全不受到其他事件的影响,我们就称其为独立事件。 例如我们在抛色子是,第一笔抛了2,第二次抛2 的概率,这两次抛是独立的,那么同时得到2 的概率可以写为:......

 

查看全文请扫支付宝¥2.4