智能语音交互技术在物联网场景中的应用

2021-12-14 16:09 来源:电子说

2021年12月10日,由电子发烧友网主办的2021年第八届中国物联网大会在深圳如期举行。物联网的发展是从连接到传感器到平台,从软件到硬件,从架构、IP到芯片再到终端。2021年必将是5G、WiFi6等技术全面应用的重要一年。本次大会邀请了Spirits、高通、百度、Qorvo、Microtech、信海科技、康杞科技、莱辛科技、瑞城信维、RT-Thread、U-Blox等公司和专家。分享和讨论剑。会议精彩纷呈,许多嘉宾享受了物联网行业的知识盛宴。

会上,电子发烧友总经理张致开幕词。张提到,“中国物联网大会”自2014年以来首次举办,今年是第八届,见证了中国物联网产业在技术和市场上的发展。本次物联网大会的主题是“构建生态,共同发展”。

他说,去年的主题是“新基础设施,智能IOT”。去年,该行业借助新基础设施和智能IOT寻求更好的落地机会。今年,是为了更好地建设生态,寻求更广阔的产业发展和突破方向。如何构建物联网生态?我想今天的峰会演讲一定会告诉你答案。

他还表示,2021年是疫情下经济发展的第二年,物联网产业的发展与电子半导体产业的发展命运相同。虽然疫情经济重创了很多行业,比如芯片短缺。然而,它也为工业增值创造了许多机会,推动和促进了IOT急需的爆发,促进了技术进步。

来自Spirits、高通、百度的物联网行业专家在会上分享了物联网技术的发展和最新的市场趋势。

精神:智能语音交互技术在物联网场景中的应用

为了让设备更智能,更好地了解用户的真实需求,有必要设计一个优秀的交互系统。Biotech IoT产品总经理任浩良带来了《IoT场景下的智能语音交互技术应用》的主题分享,谈到了智能语音的交互技术应该如何在相应的场景中。

斯皮策公司成立于2008年,是一家专注于语音技术及其解决方案输出的语音平台公司。它拥有全链路云技术。目前在研究新一代人机对话时,已经有了自己的DUI系统。同时,爱思皮奇还拥有人工智能芯片技术,还可以为车联网等物联网场景的客户提供语音相关的解决方案。

任明亮说,语音技术分为几个部分,包括语音感知、语言认知、垂直领域决策和相应决策结果的反馈。Aispeech为全链路语音技术做了一个人机对话系统,可以针对不同的场景做不同的方案。

众所周知,人工智能技术通常是依靠数据收集和训练来提升的,而Aispeech提供的是基于海量声学机器文本的对话训练。在前端设备,将涉及语音算法技术,如降噪、前端回声消除、本地语音识别等。从终端到云,再到决策对应的垂直领域服务,Aispeech可以支撑整个环节。

专利方面,Spirits拥有700多项知识产权,其中100多项为发明专利,200多项为软作品,基本集中在语音领域。而Spirit的DUI已经开辟了80多个智能家居平台,实现了万物的智能化和互联化。

对于家具领域,Spirits可以将这些服务平台分为特定的产品类型,从传感器、开关和灯具到空调、电视和冰箱。

物联网领域也有针对性的语音响应技术,如单麦、双麦、三麦、骨传导等。Spirits技术的输出可以针对不同的产品类型和芯片处理能力,比如提供各种状态下的降噪方法。

在声音采集中,识别声音的距离可达5米以上,识别率可达92%,唤醒率可达95%以上。同时我们也可以根据用户的位置做一些声源定位,比如偏差在5左右,在一些音箱和多媒体播放中可以做多通道立体声AEC降噪。在声纹识别中,识别率可达95%。

人机对话中还可以识别普通话和方言,甚至可以进行不切换的混合识别。它还使机器人能够实现连续语音识别,使人机交互更加智能。

但是在实际的家具场景中,我们经常会遇到多个语音识别,可能会导致多个设备同时唤醒。针对这一场景,爱思皮奇做了一个面对面的唤醒解决方案,哪个产品只有在用户呼叫或唤醒到哪个产品时才会响应,面对同一个方向时通过距离判断进行响应。

在人机对话中,更多的是为一些现有的产品增加价值,或者提升相应的产品体验。通过新型智能终端与场景的结合,爱思皮奇将跨渠道服务更多用户,打通原有系统,构建更多数据。

通过数据挖掘,可以提供更多的用户服务,爱思朋也将通过不同技术的迭代和努力,为未来的产品提供更好的技术服务和解决方案。

高通:物联网产业的发展需要上下游联通共同打造生态。

2021年开始,5G成为整个智能行业的两大驱动引擎之一。尤其是在疫情背景下,5G提供了高带宽、低延迟的连接,以及AI赋能的各种设备,推动了整个行业对5G与AIoT结合的极大热情。在此背景下,高通产品营销总监黎俊杰在2021年第八届中国物联网大会峰会上分享了高通在5G和物联网方面的思考和探索。

根据黎俊杰的说法,高通将物联网领域划分为八大板块,包括工业自动化和机器人、家庭和企业级智能安全、智能显示和扬声器、农业智能、公共能源、智能家居、智能城市以及数字零售和物流。

与公众的印象不同,高通在智能手机上的业务不止这些。事实上,高通已经深耕多年,无论是元宇宙还是物联网。

据了解,高通将物联网分为三个关键点,内部称为CSS。黎俊杰这样解释:第一个C代表连接,因为以前互联网是用来解决人与人之间的连接,而物联网是用来解决物与物的。

以及人与物之间的连接,所以连接是最基础的一块。

第二个S是指计算,计算可以被理解为AI,通过计算我们才能够让设备变得更智能,而不只是简单的数字采集,它会自我判断,不管在本地还是云端也好,总体而言不管它分布在什么地方,只要有计算,我们认为它就是一个智慧或者智能的体验。

在解决连接与计算之后,安全是最核心的基石。不仅仅是数据的安全,更包括的是整个在传输过程中和处理过程中的安全。因为无论是人和企业,都会存在数据隐私问题,而对这个问题的担忧必然会阻碍整个产业的发展。

李骏捷认为,连接、计算、安全,组成了整个产业的三角形,只有这样三角形存在,整个产业才会得到比较稳定的发展。

对于终端设备中,连接、安全、计算同样是其三个核心环节。连接一直以来是高通的传统强项业务,从2G到5G,再到未来的6G高通公司都在里面做出了多年的技术积累和探索。而计算方面,高通从最小的计算单元,包括CPU、DPU、再到矩阵扩展单元,高通在不断演进对计算能力和计算边界的扩展。在安全方面,高通具备硬件的安全执行环境,能全方位给客户提供一个安全的保障。

最后,李骏捷表示,整个物联网是一个生态,高通作为平台提供商,提供了产品组合,我们叫CSS,提供了连接、计算、安全的一整套方案,甚至可以提供8年左右的生命周期的维护。“从行业的上游到下游联通整个生态圈,只有所有人能够聚合在一起,然后才能够真正一起推动产业的发展。”

百度:飞桨端与边缘 AI服务平台

百度AI产品研发部经理汪学军在本次大会上带来了他们的飞桨平台,介绍了基于飞桨的AI应用。飞桨是中国第一个自主化深度学习框架,目前已经覆盖2600所高校以及百万开发者。从数据服务平台,到模型训练平台,再到端与边缘服务,最后边缘端硬件部署完成后开始运行,每一个落地环节飞桨都能完美覆盖并满足应用者需求。 飞桨数据服务平台EasyDate负责收集数据,再对数据进行标注,并对数据进行质检与清洗实现数据闭环。有了EasyDate的支持,可以大大缩减前期数据处理工作量。据汪总介绍,飞桨可以为使用者节省80%的时间与90%成本。

在完成数据收集后,模拟训练平台通过EasyDL与BML对数据进行建模,可以自动对数据进行零代码高精度模型构建。多种建模途径和预置的模型开发极大地降低了建模难度。形成数据模型后,飞桨通过EasyEdge继续对模型进行优化,对模块进行自动组合压缩让其适应端侧和边缘侧的计算能力。

EasyEdge除了对模型进行自动组合压缩,还能对端云进行协同管理,实施边缘控制。平台还能自动对模型进行评测。EasyEdge具备的转换功能可以在飞桨PaddlePaddle、TensorFlow、coffee等七种深度学习框架之间相互转换,最大限度发挥每一个算法工程师自己独有的技术站的优势,快速地编写相关AI模型。

而在模型压缩上,正如大家所知,每一个算力对应的成本一般都是一个比较固定的值,运行一个模型它需要的算力越低,对应的成本就会越低。模型压缩能够让使用者用最小的成本实现它的相关功能。 前期的工作完成后,剩下的就是端边的硬件部署。在硬件部署上百度带来了度目与Edgeboard两个系列。

度目包含了AI相机,安全生产分析盒以及AI BOX。Edgeboard则包含了学习套件,计算板卡与边缘计算盒。百度通过全自研的智能硬件,将模型的生产、下发、运行和最终的场景形成一个方案闭环。度目系列作为一个标准化产品系列,使用者只需要注入不同模型就能实现软件产品的功能定义。

而Edgeboard更像是开放式生态的硬件平台,只提供硬件与最原始的AI能力,使用者只需要集成自己的系统与整机。两个系列的合作与互补,形成了一个完整的解决方案。从软件到硬件,百度飞桨将持续为AI应用赋能。

延伸 · 阅读