2024年过去,AI又走过了狂奔的一年,大模型加速落地的热切、应用场景创新的火热和高投入、商业化缓慢带来的“下牌桌”焦虑同时处在这个行业。回过头看来,过往行业共识的一些问题在2024年中被打上了问号,例如智能算力还是否短缺、中国AI企业的“算力焦虑”是必要的吗?
如图1所示,短短几年时间,视觉预训练模型的容量扩大了300多倍,从4,450万参数的 ResNet-101 模型,进化到了拥有150亿参数的 V-MoE 模型,这些大型视觉预训练模型在图像理解和视觉内容生成等任务上都取得了长足进步。
·SegGPT是一个利用视觉提示完成任意分割任务的通用视觉模型,具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。