广告

工程师面试时必须掌握的6大机器学习算法及其优缺点(一)

时间:2022-05-18 11:51:17 作者:Challey 阅读:
在本文中,我将讨论用于构建机器学习模型的著名机器学习算法。每当您尝试从数据中提取信息、编写代码来预测事物或尝试从数据中找到推理时,您都会发现这些算法的用法。这也是为面试和考试准备提供基本 的ML 算法。
广告

在本文中,我将讨论用于构建机器学习模型的著名机器学习算法。每当您尝试从数据中提取信息、编写代码来预测事物或尝试从数据中找到推理时,您都会发现这些算法的用法。这也是为面试和考试准备提供基本 的ML 算法。

1. 线性回归与逻辑回归

线性回归是一种预测统计方法,用于对因变量与给定的一组自变量之间的关系进行建模。

线性和非线性关系

它是一种对因变量与一个或多个自变量之间的关系进行建模的线性方法。当我们只有一个自变量时,它被称为简单线性回归。对于多个自变量,该过程称为多元线性回归

逻辑回归

逻辑回归是一种广泛用于分类的监督学习算法。它用于在给定一组自变量的情况下预测二元结果(1/ 0、是/否、真/假)。为了表示二元/分类结果,我们使用虚拟变量

逻辑回归使用方程作为表示,非常类似于线性回归。它与线性回归没有太大区别,只是Sigmoid 函数正在拟合线性回归方程。

逻辑回归

线性回归的优点:

它不对特征空间中的类分布做出任何假设。

轻松扩展到多个类(多项回归)。

类预测的自然概率视图。

快速训练并且非常快速地对未知记录进行分类。

对于许多简单的数据集具有良好的准确性。

抗过拟合。

逻辑回归的缺点:

不能处理连续变量

如果自变量与目标变量不相关,则逻辑回归不起作用。

需要大样本量才能获得稳定的结果。

2. 支持向量机 (SVM)

支持向量机 (SVM) 是一组用于分类、回归和异常值检测的监督学习方法。

支持向量机 (SVM)

SVM 的优点包括:

他们最大化决策边界的边距

他们可以处理大型特征空间。

SVM 可以很好地处理半结构化和非结构化数据。

他们可以使用内核技巧的概念来解决任何复杂的问题。

SVM 的缺点包括:

当类的数量超过 2 时,SVM 可能难以实现。

SVM 需要很长时间进行训练,并且它们对噪声很敏感。

在 SVM 中选择一个好的核函数并不容易,需要大量的测试。

像gamma 和 cost-C 这样的超参数不容易微调。

3. K-最近邻(KNN

K-最近邻是一种监督机器学习算法,可用于分类和回归。它没有对基础数据分布模式做出假设。

KNN 中的对象分类是根据其最近的 K 个邻居的多次投票进行的,其中 K 可以是任何小的正整数。该算法在训练步骤中急切地学习。它可以预测一个新点是否会落入给定的集群。

应用 KNN 算法的步骤

应用 K-Nearest Neighbors 算法的步骤:

为 K(奇数)选择一个值

选择一个需要分类的样本数据点并计算到它的 n 个训练样本的距离。

对距离进行排序并取 K 个最接近的样本。

将样本数据点分配给拥有其 K 个邻居多数票的类。

KNN 算法的缺点:

KNN 在计算上很昂贵,因为它在预测阶段搜索最近的邻居来寻找新点。KNN 的内存要求很高。对异常值敏感,准确性会受到噪声或不相关数据的影响。

后面的三大算法的优缺点请关注我们或者联系作者(微信同名)。

责编:Challey
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Challey
资深产业分析师
  • 机器人服务电机控制的无MCU实现 伺服电机是实现机器人各种运动的根本性部件,实际上在工业领域的应用可以说是无处不在。本文介绍了一种设计方案,不用微控制器,而是直接利用操纵杆的模拟信号,通过将该信号变换成为伺服电机的PWM信号,完美实现了机器人手臂/伺服电机的两轴自由度控制。
  • 555时基的迷人历史和先天缺陷! 流行数十年的555时基,业内不知晓的工程师应该寥寥无几!几乎所有的数字电路教材中,都有该芯片的身影,要说是无所不在一点也不过分。然而,该电路却存在显著的输出级电流浪涌的先天设计缺陷。原设计师曾设法进行改进,来修复缺陷,但最终都未能实现,他的意志已被强大的市场力量所湮灭!
  • 热锁:用于可复原电池系统的无源故障防护技术 从电动汽车,到各种场景的不间断电源,电池/组的使用可以说是无处不在。作为分布式绿色能源,为环境可持续改善将作出越来越大的贡献。不过,随着电流负荷的不断增加以及应用的日益普及,会带来安全性方面的挑战。本文介绍的热锁技术,为解决该挑战提供了一种颇具吸引力的方案。
  • 紫光展锐基带芯片安全漏洞已修复,从NAS栈到固件详解发 Check Point Research在对摩托罗拉Moto G20手机内的紫光展锐T700芯片上的LTE协议栈的逆向工程中,发现一个被命名为CVE-2022-20210的漏洞。在将漏洞提交给紫光展锐后,已经得到及时修补,本文详解了漏洞发现的过程……
  • 利用示波器实现基本的抖动测量 对于数字系统来说,产生信号抖动的原因很多,其测量是基本的也是必须的。本文详细介绍了如何利用示波器实现基本的抖动测量,包括测量参数的定义、采样率的选取、跟踪函数和直方图的运用,测量统计方法等等。利用这些丰富的工具,可以实现低至2kHz,高达数百兆的抖动测量分析。
  • EOS/ESD每个电子制造工程师都面临的问题,来听听老师傅 ESD EOS问题如何解决,又有哪些值得注意的地方?人机台和物料究竟哪个更容易发生问题。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。
  • 新四化芯机遇 ——车规 “MCU + 2020下半年以来汽车MCU严重缺货局面至今还在持续,给刚刚起步的本土MCU厂商带来巨大的机遇
  • 龙蜥社区:Anolis OS 23正式版将于 近日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC版已在社区官网上线,正式版本将于2023年发布,它支持X86、ARM-v9、RISC-V等多种芯片架构,并集成更多核心自研组件。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了