AI领域战火再次升级。这次是人工智能另一重要分支,计算机视觉领域迎来关键转折——4月5日周三,Meta正式推出模型SAM(Segment Anything Model),称这一模型可用于识别图像和视频中的物体,甚至是从未被训练学习过的物品。
Meta上周发布了全新的人工智能模型SAM。新模型的出现,令图像识别门槛大幅降低。人工智能科学家甚至将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”。计算机视觉技术有了重大突破,哪些行业将会受益?A股市场上又有哪些公司具备技术优势?
在今年的3月中旬,OpenAi在GPT-4的发布会上表示,在未来GPT-4的应用层中将加入“图片识别理解能力”,旨在让GPT-4更好地认知现实事物,同时结合LLMs的优势理解产出相关文字内容,这一功能看上去非常酷,但OpenAi迟迟没有让这一功能上线公测,就在大家都怀疑是Open
致谢:感谢Yasmine Alfouzan、Ammar Alammar、Khalid Alnuaim、Fahad Alhazmi、Mazen Melibari和Hadeel Al-Negheimish在审查本文的早期版本时提供的帮助。
·SegGPT是一个利用视觉提示完成任意分割任务的通用视觉模型,具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。
更强大的GPT-4发布,国内ChatGPT概念股却回调走低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。
今日,一位名为Oleg Chumakov游戏开发者公开了一款几乎完全利用生成式AI制作的点击冒险游戏《生成冒险》,游戏中视觉、故事、对话、人物和地点等等一切都是生成的,据其描述,制作这款游戏他只花了三天时间,感兴趣的玩家可以进入游戏官方页面。
AI的出现,创造了许多新的玩法,抖音、小红书等自媒体平台上随处可见AI创作的身影。GPT+AI绘图相结合的AI聊天式绘画类的视频,以连续关联性AI绘画的形式呈现,娱乐感十足,刷爆了抖音和小红书,动不动就是1w+点赞,超百万曝光!