让每个人都能用上AI,百度EasyDL如何加速企业智能化?
副标题[/!--empirenews.page--]
虽然自动提款机后面没有藏着人数钱,但是垃圾桶里面却有可能藏着“人”检查你倒的垃圾——这不是一个恐怖故事,也不是一个段子,而是发生在当下的真事。只不过这里的“人”是一个“机器人”。 AI定制化需求与日俱增 我们都知道,垃圾分类万般好,实行起来却是万般难。而为了帮助人们更主动、更方便地进行垃圾分类,人工智能在很多地方也派上了用场。举例来说,此前宁波蔚澜环保科技有限公司(以下简称“宁波蔚澜”)就使用百度EasyDL零门槛AI开发平台的软硬一体开发套件制作了这样一个智能厨余垃圾回收箱——人们只要将厨余垃圾投放到垃圾箱内,垃圾被识别并称重后就可以获得市民卡返点积分,这不仅培养了市民垃圾分类的习惯,同时也利于厨余垃圾的集中处理。 人工智能正在离我们越来越近,在很多生活和工作场景中,我们都在受益于此。但是,人工智能技术范围涉略很广,从计算机识别、机器学习,到语音识别、自然语言处理等等,在不同的场景下,往往会用到不同的人工智能技术,与此同时,由于具体需求不同,用于AI模型训练的数据以及最终输出的结果也会千差万别。 再举个例子,在建筑工地上,挖掘机、推土机等大型机械车辆在行驶时经常会造成光缆的损坏。为此,安徽恒科在工地现有的监控摄像头上,结合EasyDL训练的机械车辆识别模型,实现了对工地光缆下是否有机车出现的实时监控,从而保障了光缆安全。 在这两个例子中,宁波蔚澜仅使用了217张厨余垃圾图片迭代训练两版就获得了91.57%的厨余垃圾识别模型,而安徽恒科基于对挖掘机、推土机、压路机工地运行的640图片的训练,也得到了准确率达85%的机械车辆识别模型。虽然两者涉及的均是计算机识别技术,但很明显,使用的数据以及最终得出的AI模型并不相同。 “哪怕是在同一个场景下,比如同样去检测工地的工人有没有穿工服,有的企业可能就希望在室外场景进行高空监查,有的就希望在室内场景进行低空监查。这种差异就意味着大家需要的AI能力是不同的。”百度AI技术生态部高级产品经理李景秋在百度智能云技术创新沙龙上表示。因此,在百度看来,AI的定制化已经成为企业用户非常大的需求。但是,这对企业而言,不仅耗时同时对开发人员的技术能力和业务经验也提出了相当高的要求。 EasyDL为AI定制而生 正是基于这样的市场洞察,百度在2017年底推出了EasyDL,它是一个零门槛、定制化的AI开发平台,允许用户在没有任何的算法和代码基础的前提下,也可以基于这一平台自行定制高精度的AI模型。 据李景秋介绍,目前,EasyDL推出了三个版本:经典版、专业版和行业版。其中,经典版是EasyDL在2017年底就推出的最早版本,主要面向的是AI零算法基础或者追求高效模型训练和迭代的企业用户,训练过程完全无需了解网络选型和调参细节,只需上传数据操作训练,即可获得终端AI服务;专业版主要面向专业AI工程师,允许用户灵活调参、在Notebook编程获取定制的AI服务,并且网络选型丰富,可以满足各种业务场景的需要;行业版目前聚焦零售业,是专注适配快消行业商品检测场景推出的版本,可以系统解决货架巡检、商品检测等行业问题。 比如,某箱包生产企业就基于EasyDL开发了一套“检针识别模型”,用于箱包在出厂前的最后一道质检——检查是否有生产中遗落的针、线、剪刀等物品。“传统的方式是用X光进行检测,但针线在X光下是非常不好识别的,依然可能存在漏检风险。因此,新模型就可以有效帮助企业解决质检环节的这个问题。”李景秋表示。 如此看来,“零门槛”是EasyDL的标签,但并不是唯一标签。除此之外,EasyDL所提供的EasyData智能数据服务还可以帮助用户解决数据采集、清洗、标注等一站式的数据服务,帮助用户高效获取AI开发所需的高质量数据;而基于百度深度学习平台飞桨的大规模预训练模型,还能帮助企业低成本打造高精度模型,提升AI训练效果。 EasyDL不止是“零门槛” 数据规模和数据质量是AI结果可靠性的前提和基础,而数据的标注和预处理往往需要较高的成本和较长的时间。对此,EasyData在每一个环节都提供了支持。 具体来看:在数据采集方面,EasyData支持摄像头采集图片、云服务数据回流两种方式,其中,前一种方案支持定时拍照、视频抽帧等多种方式,用户只要在摄像头中集成EasyData就能自动将本地视频流数据上传至云端,而通过数据回流还能对模型进行长线迭代,持续优化模型效果;在数据清洗方面,EasyData开放了图片清晰的完整方案,支持相似度去重、去模糊、裁剪、旋转、镜像5种标准清洗方案,以及过滤无人脸、无人体的高级清洗方案;在数据标注方面,EasyData提供了图片、文本、音频、视频四种数据格式的9种数据标注模板,支持物体检测、图像分割、文本分类三类任务场景,其中内置的百度自研Hard Sample主动学习挖掘算法,还可以针对不同智能标注任务、不同数据集进行针对性适配。 需要强调的是,虽然是零门槛,但EasyDL在保证模型训练精度方面是丝毫不含糊的。基于飞桨,EasyDL预置了百度的超大规模预训练模型,比如,在视觉任务中,图像分类训练任务预置的模型使用的是百度超过10万分类、6500万的图片数据,可以使模型平均精度提升3.24%-7.73%;在物体检测训练任务中,内置了基于170万图片、超过1000万检测框训练的超大规模预训练模型,平均精度可提升1.78%-4.53%;在自然语言处理方向,百度自研了业内效果最好的预训练模型文心ERNIE 2.0,在中文模型中,已学习了1500万篇百科语料和词语、实体知识,3亿的文章的因果结构关系,10亿次的搜索查询与结果的对应关系,2000万的语言逻辑关系知识等。可支持文本分类单标签、多标签,情感倾向分析、序列化标注等多种场景。 “这仍然不够。EasyDL还提供了自动数据增强、自动超参搜索等先进的训练机制,并且这些功能都是以非常简单的交互式操作呈现。另外,为了减少训练时长,EasyDL还使用了飞桨DGC的加速机制,可以让线上多场景模型训练时长平均减少70%。”李景秋强调。换句话说,EasyDL之所以能做到“零门槛”,是基于百度AI能力筑起的“高台阶”,借此,降低了用户的AI应用门槛。 当然,模型再完美也要部署并集成到企业的业务中才有价值。在这方面,EasyDL提供了最广泛适配的模型部署服务,包括公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。 “Everyone Can AI” (编辑:上饶站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |