原文: https://machinelearningmastery.com/machine-learning-matters/
重要的是要知道机器学习的重要性,以便您了解该领域的内在价值以及该领域的方法和开放式问题。
就像知道你的原因一样,了解该领域的价值可以作为一个强大的信息过滤器,并帮助你专注于那些真正实现该领域承诺的方法。
在这篇文章中,您将了解到机器学习很重要,因为它提供的方法可以为复杂问题创建解决方案。您将发现存在一些问题,即手动指定程序如何解决问题是不可行的。
机器学习的承诺是,它提供了生成复杂问题解决方案的工具,比我们手动编写解决方案更快,更准确,更具可扩展性。
在计算机中编写程序可以概括为对输入数据的自动化过程以创建输出工件。几乎总是,它们是线性的,程序性的和逻辑的。传统程序是用编程语言编写的,符合某些规范,它具有如下属性:
- 您知道或可以控制程序的输入
- 您可以指定程序如何实现其目标
- 您可以确定程序将做出哪些决策以及在何种条件下做出决策
- 您可以测试您的程序并确信由于输入和输出已知且所有条件都已执行,程序将实现其目标
您可以在计算机中表示一些无法编写传统程序来解决的问题。他们抵制程序和逻辑解决方案。它们具有以下属性:
- 事先不知道所有可能输入的范围
- 您无法指定如何实现程序的目标,只能指定目标是什么
- 您无法确定计划为实现其目标而需要做出的所有决策
- 您可以收集该程序的样本输入数据
这样的问题抵制了传统的编程解决方案,因为手动指定解决方案需要不成比例的资源。
您可能是程序员,您可能是一位经验丰富的程序员。这可能听起来很奇怪,甚至令人难以置信。作为程序员,我们相信只要我们能够定义程序需要做什么,我们就相信我们可以定义程序如何实现该目标。这并非总是如此。
抵制手动定义的解决方案的每日决策问题的一个示例是将垃圾邮件与非垃圾邮件区分开来。
您如何编写程序来过滤电子邮件,因为它们进入您的电子邮件帐户并决定是将它们放入垃圾邮件文件夹还是收件箱文件夹?
照片归功于 balise42,保留一些权利
我对如何做到这一点的一些想法是:
- 我会收集我知道的垃圾邮件或垃圾邮件的例子
- 我已经阅读了我收集的电子邮件,并记下了我在任何一组中看到的任何模式
- 我想把这些模式抽象成我可以编程的更一般的规则
- 我会查找可以安全快速分类为垃圾邮件或非垃圾邮件的电子邮件
- 我会为我的程序编写测试,以确保它做出准确的决定
- 我会监控部署的系统,并密切关注它所做的决定
我可以写一个程序来做这个,你也可以。这需要很多时间。必须阅读很多电子邮件。这个问题需要深入思考。在系统可信任到足以投入运营之前,需要大量的开发和测试时间。一旦投入运营,将会有如此多的硬编码规则特定于我读过的电子邮件,这将成为维护的噩梦。
上述过程还描述了针对将垃圾邮件与非垃圾邮件区分开来的问题的机器学习解决方案。一句话就是机器学习方法可以为您自动化流程。
专业提示:以这种方式解决复杂问题是一项非常有价值的技能,可以在以后为您准备数据和选择正确的机器学习方法。通过“如何手动编写程序来解决这个问题”的过程进行思考是一项经常被专业人士忽视和遗忘的掌握技巧。
机器学习领域提供了自动从数据做出决策的工具,以实现某些目标或要求。研究问题集中在如何更好地做到这一点以及结果意味着什么。
让我们专注于机器学习工具和实践的实际问题解决能力。这些机器学习的工具和实践对世界很重要。重要的四个原因是:
- 自动:机器学习方法是创建算法的自动化过程(算法)。这些方法在数据上运行并生成一个模型,指定如何实现程序的目标。
- 快速:机器学习方法可以节省您的时间。这些方法可以分析样本输入数据并提供比手动编写程序更快的程序。
- 准确:机器学习方法可以比你做得更好。作为自动化方法,他们可以在比您更多的数据上运行更长时间,以便做出更准确的决策。
- Scale :机器学习方法可以为您无法解决的问题提供解决方案。这些方法可以扩展和互连,以实现以前无法考虑或甚至构思的问题的解决方案。
在这篇文章中,您了解到机器学习很重要,因为它提供了可以为复杂问题创建解决方案的方法。具体而言,这些是抵制手动指定的解决方案的问题。
您了解到机器学习的前景是它可以比手动指定的解决方案更自动,更快速,更准确地解决这些类型的问题。
您认为哪些复杂问题无法抵抗手动编程的解决方案?发表评论。