💡
OpenAI Whisper
Intermediatecode
OpenAI的开源语音识别模型,精度高。
公司
OpenAI
成立时间
2022
总部
San Francisco, CA
价格范围
Free / open-source
难度
intermediate
目标用户
需要准确、开源语音识别能力的开发者和研究人员。
关于
Whisper是OpenAI的开源语音识别神经网络,接近人类水平的转录准确度。
优势
- 1高精度
- 299+语言
- 3多种模型大小
- 4本地运行
- 5免费
优缺点
优点
- +行业领先精度
- +免费开源
- +99+语言
- +多种大小
缺点
- −大模型需要GPU
- −大模型慢
- −无内置UI
- −设置复杂
使用场景
语音转录
音频翻译
会议转录
语音助手
无障碍工具
价格
免费版
$0
- 全部模型
- 开源
扩展与插件
Whisper GitHub
开源仓库
Whisper Python
Python包
技能
speech recognitionaudioopen sourceopenaitranscription
分享这篇文章