type
status
date
slug
summary
tags
category
icon
password
最近想白嫖阿里云服务,我整理了阿里云提供的免费语音识别(ASR)服务及其额度,方便大家快速了解和使用。文末附带对比表格。
阿里云免费 ASR 服务概览
阿里云提供了多种语音识别模型,部分模型提供免费额度,方便用户体验和测试。以下是详细信息:
1. 通义千问 ASR 模型
- 模型特点:基于 Qwen-Audio 训练,专用于中英文语音识别。目前处于 Beta 版本。
- 计费方式:按 Token 数计费。每秒音频对应 25 个 Token(不足 1 秒按 25 个 Token 计算)。
- 模型列表:
qwen-audio-asr
(稳定版,等同qwen-audio-asr-2024-12-04
)qwen-audio-asr-latest
(最新版)qwen-audio-asr-2024-12-04
(快照版)
- 支持:中文、英文,16kHz 采样率音频。
- 免费额度:10 万 Token,有效期为百炼开通后 180 天。
- 单价:目前仅供免费体验。
- 注意:免费额度用完后不可调用,请关注后续动态。不支持多轮对话和自定义 Prompt。
2. Paraformer 模型
- 模型特点:基于通义实验室新一代非自回归端到端模型,提高语音识别的精度和准确率。
- 模型列表:
paraformer-v2
:支持多种语言,适用视频直播场景。paraformer-8k-v2
:中文普通话,8kHz 采样率,适用于电话语音。paraformer-v1
:支持中文普通话、英语,适用音频或视频。paraformer-8k-v1
:中文普通话,8kHz 采样率,适用于电话语音。paraformer-mtl-v1
:支持多种语言,16kHz 及以上采样率,适用音频或视频。
- 支持:不同版本支持中文普通话、多种中文方言、英语、日语、韩语、德语、法语、俄语等。
- 免费额度:
paraformer-v2
提供每月 36,000 秒(10 小时)的免费额度,每月 1 日 0 点自动发放,有效期 1 个月。
- 单价:
paraformer-v2
定价为 0.00008 元/秒,或0.00480元/分钟,或0.288元/小时
3. SenseVoice 模型
- 模型特点:专注于高精度多语言语音识别、情感辨识和音频事件检测,支持超过 50 种语言。
- 模型列表:
sensevoice-v1
- 支持:超过 50 种语言(包括中、英、日、韩、粤等)。
- 免费额度:每月 36,000 秒(10 小时),每月 1 日 0 点自动发放,有效期 1 个月。
- 单价:0.0007 元/秒,或0.042元/分钟,或2.52元/小时
为了更直观地对比这些 ASR 服务的特性和免费额度,整理了以下表格:
模型名称 | 主要特点 | 支持语言 | 免费额度 | 计费方式 |
通义千问 ASR | 基于 Qwen-Audio,中英文识别,Beta 版本 | 中文、英文 | 10 万 Token(百炼开通后 180 天内有效) | 按 Token 数计费 |
Paraformer-v2 | 通义实验室新一代模型,高精度识别,适用视频直播 | 中文普通话、中文方言(粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话)、英语、日语、韩语、德语、法语、俄语等 | 36,000 秒/月(每月 1 日发放,有效期 1 个月) | 按秒计费 |
SenseVoice-v1 | 高精度多语言识别,支持情感辨识和音频事件检测 | 超过 50 种语言(中、英、日、韩、粤等) | 36,000 秒/月(每月 1 日发放,有效期 1 个月) | 按秒计费 |
总的来说
阿里云提供了多种 ASR 模型,其中 Paraformer-v2 和 SenseVoice-v1 均提供每月 10 小时的免费额度,而 通义千问 ASR 提供 10 万 Token 的尝鲜额度。用户可以根据自身需求选择合适的模型进行体验和使用。
- 作者:Doiiars
- 链接:http://doiiars.com/article/aliyun-free-asr-service?target=comment
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章