淘客熙熙

主题:OpenAI Whisper 转换声音到文字 -- nanimarcusboy

共:💬12 🌺51
全看分页树展 · 主题 跟帖
家园 OpenAI Whisper 使用的感受和想法 -- 补充帖

OpenAI Whisper 用了几天,一些感受。

1,监控CUDA, Windows 10

Task Manager -> GPU -> CUDA

右边一般四个框,最常用的性能,第一个隐含是3D,点一下,换成 CUDA。

我这里基本 90% 以上。

2,拿个小风扇,对着显卡吹,不然太烫了,吹了就是有点烫。

3,如果文件里人的声音不是很清楚的话,断句就没有了,字词还在,基本准确。

4,显卡的内存限制你使用的model,我的老显卡只能用 small,你要用更大的模型需要有大内存的显卡。

--

网上有人写了一个脚本 whisper_mic,可以实时识别,但是Linux的,我没有试过。

--

讯飞的桌面版我用过,但是明显在网上传数据,只能放在隔离的机器上用。

--

微信是24小时监控麦克风的,你说的内容实际上给你上传了,所以我尽量不用。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河