淘客熙熙

主题:【原创】看了《焦点访谈》,看到了利益二字 -- 鹦鹉

共:💬90 🌺66
全看分页树展 · 主题 跟帖
家园 关键问题是两个呢

一个是他的识别率,一个是他的识别模式。

识别率95%可能是可以达到,现在手机都有语音拨号,你存个语音再拨一下试试;我原来做过图像的模式识别,如果有先验条件的话,可以达到90%左右,但音频似乎比图像要困难些 —— 这个是从单个技术角度;我觉得这个方面如果把音频分解的再细一些(这对处理器要求比较高),可能在不久的将来是可以预见的。

另一个是识别模式,因为现在都是定向的识别(即给你一个模板,然后通过计算机根据具体参数去模糊匹配);但实际上如果要运用到监听系统,这个是没有模板的 —— 因为你需要监听的音频在你的资料库里是不存在的,被监听对象也不会刻意的配合你,那么如果需要匹配某个音频字段的话,这个的模糊量范围将很大,而如果模糊太大的话,那么搜索的范围和搜索的错误率将成指数倍增加。。。结论就是根本无法实际使用。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河