原文: https://machinelearningmastery.com/tour-of-real-world-machine-learning-problems/
现实世界的例子使机器学习的抽象描述变得具体。
在这篇文章中,您将继续了解真实世界的机器学习问题。您将看到机器学习如何在教育,科学,技术和医学等领域实际应用。
列出的每个机器学习问题还包括指向公开数据集的链接。这意味着如果您对特定的具体机器学习问题感兴趣,您可以下载数据集并立即开始练习。
真实世界机器学习 照片由 SMI 眼动追踪保留一些权利。
前 10 个机器学习问题的例子来自机器学习竞赛网站 Kaggle.com 。受欢迎程度取决于参赛队伍的数量。
- 奥托集团产品分类挑战赛。鉴于产品数据的特征,将产品分类为 9 个产品类别之一。
- Rossmann 商店销售。根据商店的产品历史销售数据,预测未来的销售情况。
- 自行车共享需求。鉴于每日自行车租赁和天气记录预测未来每日自行车租赁需求。
- Analytics Edge 。鉴于新时代的细节,文章预测哪些新闻纸文章会受欢迎。
- 餐厅收入预测。鉴于餐厅网站的详细信息预测了特定年份餐厅的收入。
- Liberty Mutual Group:物业检查预测。鉴于检查属性的详细信息预测了属性的危险评分。
- Springleaf 营销响应。鉴于客户的特征预测他们是否是营销目标。
- 希格斯玻色子机器学习挑战。鉴于模拟粒子碰撞的描述预测事件是否衰变为希格斯玻色子。
- 森林覆盖类型预测。鉴于制图变量预测森林覆盖类型。
- Amazon.com 员工访问挑战。鉴于员工的历史资源访问权限变化可预测员工所需的资源。
接下来的 10 个机器学习问题是加州大学 Irvine 机器学习库网站上最受欢迎的,该网站传统上托管机器学习研究社区使用的机器学习数据集。
- 虹膜数据集。鉴于以厘米为单位的花测量预测虹膜的种类。
- 成人数据集。鉴于人口普查数据预测个人每年将获得超过 50,000 美元的收入。
- 葡萄酒数据集。鉴于葡萄酒的化学分析预测了风的起源。
- 汽车评估数据集。鉴于汽车的详细信息预测了汽车的估计安全性。
- 乳腺癌威斯康星数据集。鉴于对乳房组织进行诊断测试的结果,预测肿块是否是肿瘤。
- 鲍鱼数据集。鉴于鲍鱼的测量值预测了鲍鱼的年龄。
- 葡萄酒质量数据集。鉴于葡萄酒的各种测量值可以预测葡萄酒的质量。
- 心脏病数据集。鉴于对患者的各种诊断测试的结果预测患者的心脏病量。
- Poker Hand 数据集。给定扑克手的数据库预测手的质量。
- 使用智能手机数据集识别人类活动。从智能手机移动数据预测持有智能手机的人所执行的活动的类型。
- 森林火灾数据集。鉴于气象和其他因素预测了森林火灾的烧毁面积。
- 互联网广告数据集。鉴于网页上图像的细节预测图像是否是广告。
我们对 20 个真实世界的机器学习问题进行了旋风式的考察。
这些是世界各地的科学和商业组织提出或调查的实际问题。
更令人兴奋的是,这些不同的问题具有公开可用的数据集,并且也被广泛研究和理解。
这意味着您可以立即下载数据并通过实现自己的模型来探索问题,或者从纸质或博客文章中重现其他人的问题。