通义听悟
通义听悟是阿里云推出的基于大模型的工作学习AI助手,于2023年6月1日开始正式公测。它依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验。它融合了十多项AI功能,可以提供音视频内容的实时字幕/转写、多语言翻译、内容理解/摘要,涵盖全文概要、章节速览、发言总结等高阶AI功能。针对一些细分场景,通义听悟还设置了不少“宝藏功能”,例如外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,在静音情况下入会AI可代为记录会议、整理要点,转写结果可下载为字幕文件,方便新媒体从业者视频后期制作。
分类:智能语音交互 阿里云服务器 2024/1/4