互联网爱好者创业的站长之家 – 南方站长网
您的位置:首页 >微商 >

人工智能应用落地提速,关键还得看场景化数据

时间:2021-03-12 17:46:55 | 来源:艾肯家电网

原标题:人工智能应用落地提速,关键还得看场景化数据

人工智能背后支撑的三大要素分别是数据、算法和算力。这三个要素相互促进、又相互制约。其中,数据是指为AI算法训练及优化提供相关产品与服务,主要以数据集产品和数据资源定制服务为主,具体包括数据采集、数据清洗和数据标注等内容。

其中,数据采集是指对目标领域、场景的特定原始数据进行采集的过程,采集的数据以图像类、文本类、语音类、视频类等非结构化数据为主。从业务流程角度来看,数据采集是人工智能数据服务行业全流程服务中的“第一步”,采集到的非结构化数据经过清洗与标注,才能被用于机器学习训练。

从细分结构来看,随着人工智能技术的不断成熟,更多的场景和行业开始嵌入使用人工智能技术,AI行业应用场景逐渐趋于长尾和碎片化,产生了大量新兴垂直领域的数据需求,如疫情期间的口罩识别应用等;同时,从AI应用迭代、用户体验完善的角度来看,AI应用需要更加贴合具体使用场景的数据进行迭代更新。

这些数据采集需求相对复杂、聚焦,难度较大,对AI数据服务商的场景化采集能力提出了很高的要求。云测数据为了满足人工智能落地中不同场景的需求,在业内首创了“数据场景实验室”模式,通过还原图像、语音、文本、视频等不同类型的细分场景,以解决特定场景下的数据缺失、质量良莠不齐等行业问题。

以多角度多姿态的动作采集为例,云测数据专门在横店建了一个数据采集基地,根据项目需求,进行特定动作和表情的捕捉。据了解,云测数据也是现在市面上唯一采用群演来做人工智能数据采集的数据服务商。目前,云测数据深度合作伙伴覆盖了汽车、手机、工业、家居、金融、安防、教育、新零售、地产、生态系统等行业。其中包含众多世界500强企业、高校科研机构、政府机构,头部AI企业和大型互联网企业覆盖率超90%,涵盖了计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域。

以语音识别领域的音频采集为例,为保证音频数据采集的质量,云测数据的采集工具设置了“音频检测”功能,通过对音频的底噪和能量值进行检测,可控制底噪和能量值在规定的范围之内。其中,底噪的检测是在“静默时长区域”,能量值的检测是在“说话区域”,当底噪低于规定的数值并且能量值高于规定的数值,判定音频合格,否则不合格。这种在数据采集的过程中,对数据进行预处理的方式,可大幅提升数据的采集质量并切实提升数据采集的效率。

以智能驾驶领域为例,目前,云测数据采集服务覆盖智能驾驶主流应用场景,拥有DMS与ADAS场景搭建采集经验,比如支持驾驶员信息备采、多模及车载语音采集、物体采集等众多类型。正是定制化的场景采集、丰富的数据量和高质量的AI数据交付,让云测数据与行内包括自主、合资车企,大型Tier1,以及做无人出租车的自动驾驶公司等众多企业,建立了持久良好的合作关系。

当前,不管是人工智能技术的研发以及应用领域的发展,“数据”都是一个不可或缺、位于重中之重的因素。可以说,获取还原与AI应用场景的纯净数据,是是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。只有当AI应用获取了更为准确、及时、贴合使用场景的高质量数据,才能提供更有效、有用、精准性高的智能化服务。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

猜你喜欢