英国研究生关于机器学习专业里面的重要难点课程梳理

留学在线   2021-11-11 17:36:17

Hello~大家好,由于机器学习涉及到很多领域的知识要点,所以同学们学习起来多少可能会遇到一些困难,这个问题似乎很常见,今天学姐为大家简单的介绍一下机器学习专业的简单知识点。

  线性判别分析

最简单的分类方法之一是线性判别分析。基本思想是创建一组线性函数来“决定”如何对特定对象进行分类。

iris.train %3C- iris[seq(1,nrow(iris),5),]iris.unknown %3C- iris[-seq(1,nrow(iris),5),]library(MASS)iris . LDA % 3C-LDA(Species ~)。,data = iris . train)iris . predicted % 3C-predict(iris . LDA,iris.unknown[,1:4])Misclass(iris . predicted $ class,iris.unknown[,5]) # asmisc.r

训练产生的假设允许几乎所有的植物(除了七种弗吉尼亚鸢尾)被放入适当的组。请注意,LDA不需要缩放变量。

可以用推理方法检查LDA结果。多维变化分析(MANOVA)允许理解数据和模型之间的关系(从LDA分类):

iris.unknown %3C- iris[-seq(1,nrow(iris),5),]ldam %3C-马诺娃(as.matrix(iris.unknown[,1:4])~ iris . predicted $ class)summary(ldam,test="Wilks ")

这里重要的是基于费希尔统计的p值,也是威尔克斯统计的值概率比(在我们的例子中,组的概率是没什么不同).

可以使用类似方差分析的技术来检查线性判别分析中每个字符的相对重要性:

iris.unknown %3C- iris[-seq(1,nrow(iris),5),]summary(aov(as . matrix(iris . unknown[,1:4]) ~ iris.predicted$class))

递归分区

为了取代线性判别分析,发明了背景思想相似的多种方法。递归分区,或决策树(回归树,分类树),允许,除了别的以外,制作和可视化区分键的种类,其中每一步导致将对象分成两组

种子(空)库(树)鸢尾.树%3C树(种~)。,数据=iris)绘图(iris.tree)文本(iris.tree)

我们先装了树包装包含树()函数(回归树是制作分类树的另一个包)。然后我们再次使用整个数据集作为训练数据。该图显示花瓣长度小于2.45厘米的所有植物都属于鸢尾,其余花瓣宽度小于1.75厘米,花瓣长度大于4.95厘米的植物I .云芝;所有其他的鸢尾都属于一.弗吉尼亚。

事实上,这些树是类似于“层次判别分析”的结果,并且可以将它们用于监督分类:

鸢尾。训练%3C-鸢尾[序列(1,nrow(鸢尾),5),]鸢尾。未知%3C-鸢尾[-序列(1,nrow(鸢尾),5),]鸢尾。树2 %3C-树(种~)。,data=iris.train)iris.tp2 %3C-预测(iris.tree2,iris.unknown[,-5],type="class ")库(MASS)Misclass(iris.tp2,iris.unknown[,5])

以上是关于机器学习知识概念,大家有没有从中寻找到属于自己需要的那一部分知识呢?在这里,学姐希望每一位海外留学生都能考试顺利,完成自己的全部课程学习。

本站郑重声明:"留学在线"的新闻页面文章、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与我们联系,客服邮箱756005163@qq.com,转载稿件仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。

相关推荐

留学在线