3月19日,阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键AI改写、思维导图生成等六大功能。其中,音视频问答助手“小悟”支持对单个最长6小时、一次性上百条音视频的内容理解问答。通义听悟向所有中国大陆高校师生赠送500小时音视频转写时长。
作为大模型最为活跃的领域,自然语言处理成为众多科技公司在研发上的主攻方向,阿里也不例外。6月1日,阿里云对外披露通义大模型最新进展,瞄向AI音视频赛道推出“通义听悟”,并且正式开启公测。这距离“通义千问”的发布还不到两个月的时间。
IT之家 6 月 1 日消息,今日 2023 阿里云峰会・粤港澳大湾区于广州举行,阿里云智能首席技术官周靖人宣布推出通义家族最新产品 —— 工作学习 AI 助手“通义听悟”,其依托大模型,可用于会议讨论、教学培训、调研访谈、视频观看等场景。
阿里云大模型应用产品持续升级。8月2日,阿里云通义听悟上线了三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序,帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。
它支持音视频转文字功能,单个文件最长 4 小时,单次最多可以上传 50 个文件,视频单个最大 5G ,音频单个最大 500M ,视频支持 MP4 格式,音频支持 MP3 、WAV 、WMA 、AAC 、M4A 、OGG 、AMR 、FLAC 格式。