加入收藏 | 设为首页 | 会员中心 | 我要投稿 东莞站长网 (https://www.0769zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

机器学习的几个步骤

发布时间:2021-06-09 00:42:25 所属栏目:动态 来源:互联网
导读:机器学习的应用正在迅速发展,已迅速成为医学,电子商务,银行等不同领域不可或缺的一部分。今天,我们将把机器学习分解为一个过程,并了解从开始到实现的所有步
机器学习的应用正在迅速发展,已迅速成为医学,电子商务,银行等不同领域不可或缺的一部分。今天,我们将把机器学习分解为一个过程,并了解从开始到实现的所有步骤。它的实际应用。

收集数据

为了开发我们的机器学习模型,我们的第一步将是收集可用于区分这两种成果的相关数据。可以使用不同的参数将水果分类为橙色或苹果。为简单起见,我们仅采用模型要利用的2个功能来执行其操作。第一个特征是水果本身的颜色,第二个特征是水果的形状。使用这些功能,我们希望我们的模型可以准确地区分两种水果。
 

准备该数据

一旦我们收集了这两个功能的数据,下一步就是准备数据以供进一步使用。此阶段的重点是识别并最小化我们针对这两个功能的数据集中的任何潜在偏差。首先,我们将随机化这两个水果的数据顺序。这是因为我们不希望订单与模型的选择有任何关系。此外,我们将检查我们的数据集是否偏向某个特定水果。这又将有助于识别和纠正潜在的偏见,因为这将意味着该模型将能够正确地识别一种水果,但可能会与另一种水果抗争。
 

选择模型

一旦完成了以数据为中心的步骤,选择模型类型就是我们的下一个行动方案。由数据科学家开发的各种现有模型可以用于不同的目的。这些模型在设计时考虑了不同的目标。例如,某些模型更适合处理文本,而另一种模型可能更适合处理图像。关于我们的模型,简单的线性回归模型适用于区分水果。在这种情况下,水果的类型将是我们的因变量,而水果的颜色和水果的形状将是两个预测变量或自变量。
 

培训

机器学习过程的核心是模型的训练。大量的“学习”在此阶段完成。在这里,我们使用分配给训练的数据集的一部分来教我们的模型来区分这两种成果。如果我们用数学术语查看模型,则输入(即我们的2个要素)将具有系数。这些系数称为特征权重。也将涉及一个常数或y截距。这称为模型的偏差。确定其值的过程是反复试验的。最初,我们为它们选择随机值并提供输入。将获得的输出与实际输出进行比较,并通过尝试不同的权重和偏差值将差异最小化。
 

评估

在训练好模型之后,需要对其进行测试,以查看其在现实环境中能否正常运行。这就是为什么将用于评估而创建的数据集的一部分用于检查模型的熟练程度的原因。这会将模型置于一个场景中,在该场景中遇到的情况并非其训练的一部分。在我们的案例中,这可能意味着尝试确定该模型中全新的苹果或橙子的类型。但是,通过训练,该模型应具有足够的能力来推断信息并确定该水果是苹果还是橙子。
 

结论

借助机器学习,我们可以确定如何区分苹果和橘子,尽管听起来可能并不令人印象深刻,但是对于大多数机器学习模型而言,我们采取的步骤都是相同的。随着机器学习的发展和AI的普遍发展,该标准将来可能会改变,但是下次需要进行ML项目时,请记住这些标准:

收集数据

准备该数据

选择模型

训练

评估

超参数调整

预言

(编辑:东莞站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!