淘客熙熙

主题:吃螃蟹的下场 -- 晨枫

共:💬72 🌺261
全看分页树展 · 主题 跟帖
家园 对语音控制指令的识别是启发式的

本人接触过几个项目,恰好与车载设备语音控制有关,增长的一点相关知识。

简单的说,对语音控制指令的识别是启发式的,而且在很多情况下会利用上下文缩小范围,以增加识别的准确率。整个指令集根据指令涉及的功能分为若干大类,每一种类中,又分为与车载设备功能相对应的小项。然后,针对某一小项,某一语种,借助语言学的统计,将最常见的表达方式以穷举的方式列出,配以各色人等分别录音,用这些素材对语音识别软件加以训练。

用户发出指令时,

实际上只有一部分是可以作为一级指令加以直接识别的,比如,“到动物园的路线”、“播放第2首歌”等。还有很多的指令是在上下文环境下识别的,比如先说,“显示歌曲列表”,再说“播放<光阴的故事>”。在这种情况下,每二条指令的上下文被缩小了,至于歌曲名<光阴的故事>,类似的歌曲名在相应的语言库中早就被收集了,识别程序是在听着像的里面挑选。

此外,这些功能仅涉及到了一些相对安全的功能,诸如打开/关闭空调之类,至于与行驶有关的控制,(比如关闭巡航、加速之类)恐怕一时半会儿不会出现。

语音控制其实只是卖车的一个噱头,给产品披上高科技的外衣。非要说是能使驾驶者腾出手来不至因操作面板分心影响安全倒是也能说得过去。不过总得来说,尽管目前还只是中看不太中用的玩意儿,但还是代表了将来的发展趋势,随着车载设备处理能力的提高,可以想见可识别指令集会不断扩大。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河