188bet网投Udacity有一个独特的机会,有两个思想领导人就题为机器学习培训数据的小组讨论AI-AI-Oh !在SXSW 2019期间。讨论触发了专家小组成员之间的观点交换,这些观点来自如何在各个行业中使用数据,你需要多少训练数据来应用机器学习,以及观众考虑的实用提示。
您可以倾听我们的小组讨论的整体这里。
讨论从机器学习的框架开始。机器学习(ML)是关于教会计算机如何从数据中学习来做出决定或预测。要实现真正的机器学习,计算机必须能够在没有明确编程的情况下学习识别模式。
机器学习算法的一个简单示例是按需音乐流服务。对于服务做出决定哪些新歌或艺术家推荐给倾听者,机器学习算法与具有类似音乐味道的其他侦听者将侦听器的偏好与之相关联。
机器学习燃料促进各种行业的各种自动化任务和跨度,从数据安全公司狩猎恶意软件,以融资专业人士寻找有利的交易。它们旨在像虚拟个人助理一样工作,他们工作得很好。
机器学习的机械功能与手电筒、汽车或电视的功能相同。当某样东西能够“机器学习”时,它就意味着它能利用提供给它的数据执行一个功能,并且在这个功能上做得越来越好。就像你有个手电筒,你说什么时候亮就什么时候亮“黑暗”,所以它会认出包含这个词的不同短语“黑暗”。
在机器学习项目中,我们需要培训数据集。这是实际的数据集用于训练模型执行各种动作。
ml严重依赖于数据;没有数据,不可能学习“ai”。它是最重要的方面,使算法训练成为可能。小组成员讨论三种不同类型的培训数据,包括:
客户服务数据-来自客户的数据。Hector Urdiales表示:“在HubSpot,我们为ML收集用户生成的培训数据,从电子邮件发送时间优化到受众定位。
用户生成的数据- 用户自己创建的数据而不会出现提示。“我们培训基于模式的数据,”Rob McGrosty说。
模拟数据- 例如,自动驾驶汽车的传感数据,例如,在现实世界中收集。“测试车辆的相机可能会记录晚上穿过街道的行人的视频。软件开发人员每次更新自动驱动软件时都可以使用该视频,以验证软件仍然正确地检测到行人,“大卫银说明。
从本质上讲,培训数据是教科书,它将教授您的AI进行分配的任务,并将在又一遍地一遍又一遍地使用,以微调其预测并提高其成功率。您的AI将以多种方式使用培训数据,所有这些都是提高其预测的准确性。
很简单,没有训练数据就没有人工智能。数据的清洁度、相关性和质量直接影响AI能否实现目标。
一定要听参加这个信息丰富的小组讨论,并了解更多关于培训数据和实际用例的信息。