不同机器学习种类
机器学习的种类有很多分法,而我将主要介绍从任务和从训练模式的角度介绍不同机器学习的算法。
任务视角
机器学习可以解决不同任务相关的问题,例如我们可以用 ChatGPT 聊天,我们也可以用人工智能去读取医学影像。
但是不同任务我们通常使用不同的模型。我们通常将任务分类为:
- 自然语言处理(NLP)
和语言相关的任务,例如语言翻译(Machine Translate,MT)、情感分析(Sentiment Analysis)等任务。 - 机器视觉(Computer Vision)
和图片、视频相关的任务。例如通过读取图片去区分图中的植物种类等。 - 聚类
- 分类 例如需要将给定的数据点分类成有问题和没问题等。
等等。机器视觉可以解决很多种类的任务。
学习方式
监督学习(Supervised Learning)
监督学习是最常见的学习方法。其为模型提供的数据集的格式为很多对数据点和其相对应我们期望模型的输出。
我们以预测成交房价为例,我们希望通过其所处在的位置,其最初的价格,其区域的平均房价作为输入,预测其最终的成交价格。因此我们需要
输入: 房子所处在的位置,最初的价格,区域平均房价
输出: 最终的成交价格
因此我们的数据对会变成:
在监督学习中,我们总是把模型输入数据和我们期望模型的输出作为一个对(pair)用于训练。而输入数据我们也称之为特性(features),而输出内容我们称之为标签(label)。因此对于给定一个数据,我们给其打标签(labelling)的本质就是我们在给定一些特性,人为为其标注标签。
而一个数据集通常会包含很多对这样的数据。而且每一个数据对有相同的元素个数。
非监督学习(Unsupervised Learning)
非监督学习和监督学习最大的区别是在于其的数据集格式并不相同。每一个数据对不再包含模型的期望输出,即
我们将只将这些数据输入模型,模型通过一些手段学习。
而正因为我们没有给其我们期望的输出,模型需要自行寻找数据内的关系。
因此监督学习和非监督学习也通常会应用在不同的任务。例如非监督学习可以用于训练图像生成网络或者信息压缩网络等。