编辑
来看一下吧,这是一个案例来说明机器学习过程,可以说很清楚了,
这里用来预测一个人的健康状况
1.首先要预测这个人的健康状况这里需要把用户特征,比如用户特征为x,而x可以有多个,
用户的健康状况我们定义为y,那么这里,我们可以这样想一下,我们用一个公式:
y = a+bx 那么这里的a,b,我们都可以称之为参数,实际上这个参数又被叫做权重,
那么对于上面的,y = a + bx 这里我们 x可以从x0到xn,那么这里的w 也就是相当于我们公式里的
a 和b 也可以说w0 到w1,其实w0 就对应了x0的比重,也就是说w0是代表了x0这个输入数据的
重要程度,w0到wn,和x0 到xn是一一对应的,那么这里,我们就规定,w0相当于公式里的a,wn相当于公式里的b,那么y=w0+wnxn 这里我们让x0是一个常数为1,那么这个时候,实际上就是我们把x0到xn,分成了,x0 和 x1到xn,当然我们把w0 到wn 也分成了 w0 和w1 到wn. 这里要注意,上面我们说的这个公式,在这里就叫做模型model.
2.然后当我们输入用户的特征也就是比如,x1,x2,...身高体重啊等等,输入以后,可以看到1就是这个过程
3.然后数据x1,到xn 和W 权重,也就是参数一起计算 可以看到2 这个过程,就得到了一个预测结果,
我们称为 y^ 不是这样写的,在y上面有个向下的尖括号,读作,y估计,也就是预测的y的结果,
4.然后我们再准备好,y的实际情况是什么,这个时候y的实际情况和y估计就有一个差值,这个误差值,
ε 叫做随机误差,读作 e bu sai 咯,太难了..我天...这个可以加个绝对值给这个误差.
5.那么y^ 估计和 y的绝对值,也就是ε 这个值越小越好,那么怎么来让这个ε 变小呢,这里就要用到一个重要的方法,叫做梯度下降法...这个可以暂时知道就行...统计学里的因变量预测值y上面的小帽子"∧"怎么念,这个啊,读作y hat 也叫做y 帽,读作y 估计也行,表示是个预测值.以后就读y hat就行.
6.然后我们再反过来根据这个绝对值,也就是误差绝对值ε ,来调整权重w, 这里用到的一个方法就是梯度下降法,也就是根据误差,来调整W权重,注意这里的W是大写的,表示可以从W0 到Wn ,表示权重
是个集合.
编辑
7.然后第一次根据误差 ε 调整完了w权重以后,再进行输入x数据进行计算,又会得到一个预测y,
y hat 1比如这里叫做,y^1 然后,拿着这个y^1 再去和真实的值进行对比,得到一个绝对值,新的一个
误差值比如ε 1,那么这个时候要,用ε 1 和上一次的ε 进行对比一下,因为我们希望误差,ε 越来越小,所以,这里就看一下如果ε 误差变小了,那么就说明,我们的调整方式是对的,就继续按照这个方式调整就可以了,如果ε 误差变大了,说明我们的梯度下降算法,找到不对,我们需要找其他的方法来调整权重.
8.就是这样,
编辑
9,然后我们再去按照上面的过程,再去不停的得到y^ n然后再去跟真实的y结果对比,得到误差值,然后再去,根据误差值 ε,调整权重,不停的调整,等到最后你会发现,不管你怎么调整w权重,最后得到的
ε e bu se lo 这个误差都不变了,那么这个时候,你就可以取做test set,也就是拿着真实的数据去,做测试了.
10.可以看到,机器学习,上面我们说的有监督的机器学习其实就是一个迭代的过程对吧,所以我们要做的往往就是,怎么样让迭代的次数,变少,或者说是让迭代的速度变快,来优化我们的系统.
留言与评论(共有 0 条评论) “” |