语音识别 ASR: FunASR、SenseVoice-Small

在语音识别(ASR)领域,FunASR 和 SenseVoice-Small 是两种不同定位的轻量级模型,适用于不同场景。以下是详细对比及选型建议:

1. FunASR(阿里云)

定位:阿里云推出的实时流式语音识别服务,专为低延迟、高并发场景设计。

核心优势:

低延迟:端到端延迟低至 200ms,适合实时交互(如电话客服、直播字幕)。

高准确率:在通用场景(如会议、采访)中识别率达 95%+,支持多方言(如粤语、四川话)。

分类:软件 阿里云服务器 2025/3/16