神经网络算法 - 一文搞懂回归和分类

发布时间:2024-02-23  

本文将从的本质、的原理、的算法三个方面,带您一文搞懂回归和分类 Regression And Classification 。

本文引用地址:


回归和分类

一、回归和分类的本质

回归和分类是机器学习中两种基本的预测问题。它们的本质区别在于输出的类型:回归问题的输出是连续的数值,分类问题的输出是有限的、离散的类别标签。

回归(Regression)的本质:回归的本质是寻找自变量和因变量之间的关系,以便能够预测新的、未知的数据点的输出值。例如,根据房屋的面积、位置等特征预测其价格。


回归的本质

  • 自变量个数:

  • 一元回归:只涉及一个自变量和一个因变量的回归分析。

  • 多元回归:涉及两个或更多个自变量和一个因变量的回归分析。

  • 自变量与因变量的关系:

  • 线性回归:自变量与因变量之间的关系被假定为线性的,即因变量是自变量的线性组合。

  • 非线性回归:自变量与因变量之间的关系是非线性的,这通常需要通过非线性模型来描述。

  • 因变量个数:

  • 简单回归:只有一个因变量的回归分析,无论自变量的数量如何。

  • 多重回归:涉及多个因变量的回归分析。在这种情况下,模型试图同时预测多个因变量的值。

分类(Classification)的本质:分类的本质是根据输入数据的特征将其划分到预定义的类别中。例如,根据图片的内容判断其所属的类别(猫、狗、花等)。


分类的本质

  • 二分类(Binary Classification):表示分类任务中有两个类别。在二分类中,我们通常使用一些常见的算法来进行分类,如逻辑回归、支持向量机等。例如,我们想要识别一幅图片是不是猫,这就是一个二分类问题,因为答案只有是或不是两种可能。

  • 多分类(Multi-Class Classification):表示分类任务中有多个类别。多分类是假设每个样本都被设置了一个且仅有一个标签:一个水果可以是苹果或者梨,但是同时不可能是两者。在多分类中,我们可以使用一些常见的算法来进行分类,如决策树、随机森林等。例如,对一堆水果图片进行分类,它们可能是橘子、苹果、梨等,这就是一个多分类问题。

  • 多标签分类(Multi-Label Classification):给每个样本一系列的目标标签,可以想象成一个数据点的各属性不是相互排斥的。多标签分类的方法分为两种,一种是将问题转化为传统的分类问题,二是调整现有的算法来适应多标签的分类。例如,一个文本可能被同时认为是宗教、政治、金融或者教育相关话题,这就是一个多标签分类问题,因为一个文本可以同时有多个标签。

二、回归和分类的原理


线性回归 VS 逻辑回归

回归(Regression)的原理:通过建立自变量和因变量之间的数学模型来探究它们之间的关系。

线性回归

线性回归(Linear Regression):求解权重(w)和偏置(b)的主要步骤。


求解权重(w)和偏置(b)

  • 初始化权重和偏置:为权重w和偏置b选择初始值,并准备训练数据X和标签y。

  • 定义损失函数:选择一个损失函数(如均方误差)来衡量模型预测与实际值之间的差距。

  • 应用梯度下降算法:使用梯度下降算法迭代更新w和b,以最小化损失函数,直到满足停止条件。


梯度下降算法迭代更新w和b

  • 获取并验证最终参数:当算法收敛时,得到最终的w和b,并在验证集上检查模型性能。

  • 构建最终模型:使用最终的w和b构建线性回归模型,用于新数据预测。


新数据预测

分类(Classification)的原理:根据事物或概念的共同特征将其划分为同一类别,而将具有不同特征的事物或概念划分为不同类别。


逻辑回归

逻辑回归(Logistic Regression):通过sigmoid函数将线性回归结果映射为概率的二分类算法。

  • 特征工程:转换和增强原始特征以更好地表示问题。

  • 模型建立:构建逻辑回归模型,使用sigmoid函数将线性组合映射为概率。

  • 模型训练:通过优化算法(如梯度下降)最小化损失函数来训练模型。

  • 模型评估:使用验证集或测试集评估模型的性能。

  • 预测:应用训练好的模型对新数据进行分类预测。


猫狗识别

三、回归和分类的算法

回归(Regression)的算法:主要用于预测数值型数据。

  1. 线性回归(Linear Regression):这是最基本和常见的回归算法,它假设因变量和自变量之间存在线性关系,并通过最小化预测值和实际值之间的平方误差来拟合数据。

  2. 多项式回归(Polynomial Regression):当自变量和因变量之间的关系是非线性时,可以使用多项式回归。它通过引入自变量的高次项来拟合数据,从而捕捉非线性关系。

  3. 决策树回归(Decision Tree Regression):决策树回归是一种基于树结构的回归方法,它通过构建决策树来划分数据空间,并在每个叶节点上拟合一个简单的模型(如常数或线性模型)。决策树回归易于理解和解释,能够处理非线性关系,并且对特征选择不敏感。

  4. 随机森林回归(Random Forest Regression):随机森林回归是一种集成学习方法,它通过构建多个决策树并将它们的预测结果组合起来来提高回归性能。随机森林回归能够处理高维数据和非线性关系,并且对噪声和异常值具有一定的鲁棒性。

分类(Classification)的算法:主要用于发现类别规则并预测新数据的类别。

  • 逻辑回归(Logistic Regression):尽管名字中有“回归”,但实际上逻辑回归是一种分类算法,常用于二分类问题。它通过逻辑函数将线性回归的输出映射到(0,1)之间,得到样本点属于某一类别的概率。在回归问题中,有时也使用逻辑回归来处理因变量是二元的情况,此时可以将问题看作是对概率的回归。

  • 支持向量机(SVM):支持向量机是一种基于统计学习理论的分类算法。它通过寻找一个超平面来最大化不同类别之间的间隔,从而实现分类。SVM在高维空间和有限样本情况下表现出色,并且对于非线性问题也可以使用核函数进行扩展。

  • K最近邻(KNN):K最近邻是一种基于实例的学习算法,它根据输入样本的K个最近邻样本的类别来确定输入样本的类别。KNN算法简单且无需训练阶段,但在处理大规模数据集时可能效率较低。

  • 朴素贝叶斯分类器:朴素贝叶斯是一种基于贝叶斯定理的分类算法,它假设特征之间相互独立(即朴素假设)。尽管这个假设在实际应用中往往不成立,但朴素贝叶斯分类器在许多领域仍然表现出色,尤其是在文本分类和垃圾邮件过滤等方面。


文章来源于:电子产品世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    像处理和计算机视觉方面,无监督模式识别技术用于对象检测和图像分割。无监督学习通过让神经网络持续根据新输入调整自身来训练无监督神经网络。无监督神经网络可根据包含未标记响应的输入数据的数据集进行推断。您可以......
    。VGG在图像分类和物体检测方面非常有效。 神经网络可在焦点损失的情况下进行训练,基线方法会在第一个卷积层期间使用VGG特征提取器。经过专门设计,神经网络可以......
    ,同时使用VGG骨干网,可输出边界框坐标的二维回归结果和分类分数。术语“骨干网”是指将输入数据合成为特定特征表示的特征提取网络。VGG在图像分类和物体检测方面非常有效。 神经网络可......
    的作用是执行对于传统视觉或模式识别系统来说具有挑战性的任务。通过使每个神经网络各自不同,并针对特定任务进行设计,它可以更高效、更精确地执行任务。 所有神经网络的组织模式都是在多个层面上多次处理数据。因此,神经网络可以......
    的编程工具可以应用于更大的硅光子神经网络。 泰特团队用一个拥有49个节点的硅光子神经网络来模拟某种微分方程的数学问题,并将其与普通的中央处理单元进行比较。结果表明,在此项任务中,光子神经网络......
    ,普林斯顿大学的 Alexander Tait 团队创建了全球首个光电子神经网络,并展示了其在计算上的超速度。 一直以来,光学计算都被寄予厚望。光子的频宽要比电子高,因此可以更快地处理大量数据。但是......
    既灵活又不至于太复杂。这里的f(⋅)就是激活函数。线性模型的表达能力不够,它的作用就是来增强模型的表示能力。人工神经网络可以很多层连接在一起,因此在人工神经网络中,主要......
    的一项值得关注的优势在于它允许通过少量硬件和处理功率在边缘作出复杂决定——低成本 ARM 或 FPGA 基础系统和全新推断工业相机,如 FLIR  可以做到。 使用Neuro技术将经过训练的神经网络部署到FLIR的上,并通......
    元和突触的特征。团队设计了相同材料和相同结构的人工神经元和突触器件,与传统基于硅CMOS的人工神经模仿器件的复杂结构不同,新开发的器件确保了易处理性和网络可扩展性,为大规模人工神经网络......
    卷积神经网络简介:什么是机器学习?——第一部分;摘要 随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本系列文章基于此解释了卷积神经网络(CNN)及其......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>