人工智能声纳眼镜能识别唇语

智行网 2023年04月11日 13:24 0

准确率约为95%

【总编辑圆点】

科技日报北京4月9日电(记者张佳欣)美国康奈尔大学研究人员表示，声音传感器和http(/1000.cn/)，最多可以连续识别31条无声命令，该系统可以帮助一时难以说话或不能发声的人。论文将在本月德国汉堡召开的计算机协会计算系统人为因素会议上发表。

此眼镜是一个名为EchoSpeech的静音语音识别界面。该眼镜配备一对麦克风和比铅笔橡皮擦小的扬声器，采用可穿戴的人工智能驱动声纳系统，通过面部收发声波，感知嘴部活动。然后呢，深度学习算法实时分析这些回波轮廓，准确率约为95%。这款低功耗可穿戴眼镜只需几分钟的用户训练数据就可以识别命令，并在智能手机上运行。

EchoSpeech可用于在不方便或不合适的地方通过智能手机与他人交流，例如喧嚣的餐厅或安静的图书馆。静音的语音界面可以和触控笔配对，可以和CAD等设计软件一起使用，几乎不需要键盘和鼠标。

研究人员称，他们正在向人体“运送”声纳技术。体积小、功耗低、隐私敏感，这些都是将新的可穿戴技术引入现实世界的重要功能。用于静音语音识别的许多技术局限于所选择的预定命令集合需要佩戴用户的脸和照相机。这不实用，不可能。可穿戴摄像头也存在严重的隐私问题，对用户和与之交流的人来说也是如此。 EchoSpeech等声音传感技术消除了对可穿戴相机的需求。

此外，由于音频数据比图像和视频数据小得多，EchoSpeech可以以更小的带宽通过蓝牙实时传输到智能手机，数据位于本地，位于云中机密信息的安全性得到了保证。

今年以来、人工智能再次引起了巨大的关注。几年前，专家们曾探讨如何更准确地理解人工智能人的意图，与人进行多次对话。曾经，让人工智能读唇的，还是科幻电影中的桥段。现在，这些正在迅速成为现实。面对人工智能带来的超出预想的变化，不能停留在“野马”的阶段。人们要真正思考，才能更好地支配人工智能，利用它造福人类，尽量避免它可能带来的麻烦。

人工智能声纳眼镜能识别唇语

相关内容