AI Study Online
💡

OpenAI Whisper

Intermediate
code

OpenAI的开源语音识别模型,精度高。

公司

OpenAI

成立时间

2022

总部

San Francisco, CA

价格范围

Free / open-source

难度

intermediate

目标用户

需要准确、开源语音识别能力的开发者和研究人员。

关于

Whisper是OpenAI的开源语音识别神经网络,接近人类水平的转录准确度。

优势

  • 1高精度
  • 299+语言
  • 3多种模型大小
  • 4本地运行
  • 5免费

优缺点

优点

  • +行业领先精度
  • +免费开源
  • +99+语言
  • +多种大小

缺点

  • 大模型需要GPU
  • 大模型慢
  • 无内置UI
  • 设置复杂

使用场景

语音转录

音频翻译

会议转录

语音助手

无障碍工具

价格

免费版

$0

  • 全部模型
  • 开源

扩展与插件

Whisper GitHub

开源仓库

Whisper Python

Python包

技能

speech recognitionaudioopen sourceopenaitranscription
分享这篇文章

相关工具