人工智能基础-机器学习任务之常规解决的六大问题--粉丝服务平台-粉丝头条-fensifuwu.com

人工智能基础-机器学习任务之常规解决的六大问题

科技 06-28 来源： HELIX人工智能实验室

机器学习并不是简单的玩数学游戏，它是能真刀真枪的解决很多实际问题的。简单归纳总结一下，机器学习主要解决六大类任务或者叫问题：分类问题、聚类问题、回归问题、关联问题、序列问题。

异常检测问题

1. 分类问题（Classification)

抽象来看，分类问题就是构造一个分类器（Classifier），可以对数据样本的类别进行预测。分类器可以理解为一个函数：y=f(x)，其中x是自变量，y是因变量并且y的取值不是数值而是一个类别标签。当我们知道了x的取值之后，就可以根据f(x)来预测y的值。分类问题属于机器学习中的有监督学习。

典型的分类问题有：

判断一封邮件是否是垃圾邮件

判断一篇文章属于什么类型（例如体育类，财经类，娱乐类等)

判断贷款申请者的信用度好坏

检测信用卡消费是否存在欺诈行为

图像分类：识别图片中的物体

预测用户是否会流失

预测用户对营销活动是否会响应

预测用户对广告是否会点击

预测用户对商品是否有兴趣购买

2.聚类问题（Clustering）

“物以类聚，人以群分”，这就是聚类，它的目的就是要把相似的数据聚在一起。例如通信运营商可以对手机用户的通话行为进行聚类，把喜欢上网的聚类一类，喜欢夜间打电话的聚为另外一类。你也可以对大量的文章进行聚类，把相似的文章聚为一类然后归到同一个文件夹中。聚类问题属于机器学习中的非监督学习。

典型的聚类问题有：

用户分群：企业对用户的消费行为进行聚类，把用户划分为不同的人群，然后对用户进行差异化的营销和服务。

相似文档归类：对大量的文档进行聚类分析后，把文档分为若干个不同的类

注意：聚类和分类都有一个“类”字，但是它们有显著的差别：分类问题的“类”就是训练样本的标签，这个标签是训练模型之前需要事先标记好的，分类算法的目标是建立一个对标签进行预测的模型；而聚类的“类”，是聚类算法需要对数据进行学习之后才能得到的结果，在训练模型之前我们是不知道样本的类标签的。

3.回归问题（Regression）

回归问题和分类问题非常像，它们都属于监督学习的范畴。分类问题要构建的是分类器（Classifier），而回归问题需要构建的就是一个回归器（Regressor）。回归器也是一个函数：y=f(x)，其中x是自变量，y是因变量，与分类问题不同的是，y的取值是数值而不是类别。当知道了x的值之后，就可以通过f(x)来预测y的值。

典型的回归问题有：

根据房屋的特征来预测房屋的价格

根据商品的特征来预测商品的销量

4.关联问题（Association Rule）