主题:OpenAI Whisper 转换声音到文字 -- nanimarcusboy
没看懂, 既然用 API 对文件大小有限制, 那就买块显卡本地跑, 就是个电费.
我跑过最大的一个视频文件2G 的MP4, 转换成 wav 文件大概 400M, wav 文件大概一个小时200M左右, 运行需要的时间大概 1:1 , 不过我的显卡太老了.
如果买块3080的是不是会跑的飞快.
而且作者似乎不知道应该用显卡跑, 用CPU太弱了.
"
OpenAI开源了语音识别模型Whisper,这个模型你是可以本地跑的,配合训练好的数据集可以离线识别语音,但是对机器配置有要求,另外你想识别效果好,得好几G的存储和内存。它也提供了API,这样服务端可以帮你跑,不需要你本地运行程序,但是一次最大文件大小25MB,价钱10分钟6美分
"
- 相关回复 上下关系8
🙂OpenAI Whisper 转换声音到文字 34 nanimarcusboy 字2899 2023-02-12 02:35:21
🙂利用 Whisper 服务识别,速度是本机的 20 倍 nanimarcusboy 字727 2023-04-14 06:17:41
🙂没看懂, 既然用 API 对文件大小有限制, 那就买块显卡本
🙂Whisper 隐含是英文,模型用 small.en,语言不 2 nanimarcusboy 字574 2023-02-26 06:28:47
🙂请教下,可以识别中文语音然后翻译成英文吗 hamigua 字9 2023-06-03 00:39:47
🙂试了下是可以的,多谢楼主了 hamigua 字283 2023-06-03 07:45:19
🙂OpenAI Whisper 使用的感受和想法 4 nanimarcusboy 字864 2023-02-22 06:01:33
🙂你显卡是哪一代的 1 川普 字78 2023-04-14 23:23:40