1月26日,百川智能宣布正式上线Baichuan-Omni-1.5开源全模态模型。该模型不仅支持文本、图像、音频和视频的全模态理解,还具备文本和音频的双模态生成能力。在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5的表现均优于GPT-4o mini。
Omni 是一个浏览器插件,它让你能够想使用 Mac 电脑一样使用你的浏览器,最近 Omni 接连登上 Github 趋势榜与 ProductHunt 榜首,成为大受各种程序员、产品设计师的追捧的生产力工具!
欲做AI模型算力“超级放大器”、为人工智能提供设施的清华系初创企业推出端侧开源模型。12月16日,上海无问芯穹智能科技有限公司推出端侧全模态理解的开源模型Megrez-3B-Omni,30亿参数尺寸适合手机、平板等端侧设备,具备图片、音频、文本三种模态数据处理能力。