【监督学习和无监督学习概述】吴恩达机器学习笔记EP1(P1-P10)
从今天开始我将学习吴恩达教授的机器学习视频,下面是课程的连接1.1 欢迎来到机器学习!_哔哩哔哩_bilibili。一共有142个视频,争取都学习完成吧。
机器学习的分类
课程先对机器学习大致分了类。主要的学习方式有两种,一种是监督学习,还有一种是无监督学习。另外还有的一种学习方式是强化学习。
监督学习
回归
回归问题可以看作给算法一个数据集(正确答案)labels,然后学习算法的任务是产生更多这样的正确答案。
这样特定类型的监督学习称为回归(Regression)。
分类
这里以辨别癌症良恶性作为例子:
分类问题种也可以分多个类。
预测类别可以是数字的,也可以是非数字的。
多属性输入预测(输入多个因素进行预测),通过已有数据拟合一条边界线进行分类。
监督学习的两种方法比较
回归问题算法从无限多可能的输出的数字中预测数字。
分类问题算法对一个类别进行预测,所有可能的输出都是一个小组。
无监督学习
聚类
聚类问题中没有任何标签labels,无监督学习从数据集中找到某种结构或某种模式,或只是在数据中找到一些关联。
将数据分为两个或多个不同的组或集群的这类无监督任务称为聚类算法。
异常检测和降维
无监督学习的另外两种任务。
异常检测主要用于检测数据集中异常的部分,通常用于检测经济上造假之类的问题。
降维中的一个应用是在尽可能减少信息丢失的情况下压缩数据集。
回归模型
下面一张图片是对数据集中数据的名词解释。
x是输入特征。
y是输出目标。
在x和y上面做角标,这个不代表平方,只是对数据进行标签整理。
f是函数function,在机器学习中就是所谓的模型。
通过输入特征x输入到模型f中,得到模型输出y-hat,我们进行机器学习就是希望这个y-hat与输出目标y越接近越好。
f可以有很多表示,下面这个是最简单的一种模型,linear model。