免费使用Elevenlabs的语音识别大模型Scribe_v1
号称球表最强人工智能语音公司 ElevenLabs最近推出了一款语音识别模型 scribe_v1,支持99种语言的音频转录为文字。
而且免费额度还挺高,单次支持上传 1G的音频或视频文件。
在视频翻译软件 pyVideoTrans中使用
本文介绍两种使用方式,在线web使用
在视频翻译软件中使用
升级到 v0.59版本 https://pvt9.com/downpackage
进入该页面创建一个 api key: https://elevenlabs.io/app/settings/api-keys
在视频翻译软件 菜单–TTS设置–Elevenlabs.io中填写你复制的api key,然后保存
在语音识别渠道中选择 Elevenlabs.io就可以使用了。
在网页中使用
- 进入该网页 https://elevenlabs.io/app/speech-to-text,如果没有账号请邮箱注册,无需手机验证无需绑卡无需充值。
- 登录后左侧点击Speech to text,如下图操作
- 等待转录完成后,点击显示的名字进入转录结果页