为何AI难以精准生成人类手部——技术瓶颈与认知挑战的深层解析 一、解剖学复杂性:高维动态结构的建模困境手部是人体最复杂的机械结构之一,包含 27块骨骼、34块肌肉 和 120+个韧带,其运动涉及 20个自由度(远超面部表情的44块肌肉)。
3月21日,新京报贝壳财经记者购买了Midjourney会员并尝试使用V5算法模型生成图片,发现相比此前AI绘图模型总是在手指数量上犯的错误,V5确实能够大概率生成准确的手指,相比去年的AI绘图模型有了长足进步,不过若放大观看,个别生成图片的手指细节仍有缺憾。
不用到照相馆做“妆造”,花9.9元就能用AI技术生成一组精美的写真照;想写文章,在AI工具里输入诉求与关键词,即可生成文本;做题遇到困难,用AI模型工具就能找到答案……AI即人工智能。“30秒搞定一张插画图、5分钟生成一篇爆款文章。”近来,AI正在从抽象的概念走进日常工作和生活。
日前,西藏日喀则市定日县发生6.8级地震,牵动着许多网友的心。但与此同时,一些关于灾情的不实信息,也在网络上公然传播。近日,一张“小孩被压废墟下”的图片在网上引发广泛关注。实际上,这张图片由AI生成。究竟怎么一回事?来看记者的调查。
文|胡炜(新京报传媒研究院)在当下,AI创作正是风口,不少媒体人担心有人利用AI生成(伪造)新闻现场照片甚至视频。果然,怕什么就来什么:近日,在西藏日喀则市定日县发生的地震灾害牵动人心,就在大家为灾区揪心、全力救援之时,一些AI生成的虚假影像在社交平台上广泛传播,引发误导。
在接受《环球时报》记者采访时,多名人工智能与互联网业内人士认为,Midjourney V5版本代表了目前生成式AI的前沿水平,其生成的图像在某些领域已经得到商用,通过继续学习和技术迭代,预计其能力可以进一步增强。
西藏日喀则市定日县发生的地震灾情牵动人心,当地流传出的各种救援画面,更是令人揪心不已。然而,却有一些不真实的内容趁机浑水摸鱼,利用人们的同情心进行误导、吸引流量。某视频平台上一位博主发布的照片显示:一个戴帽子的小孩被压在倒塌的建筑物下,全身铺满尘埃。
·肉眼分辨图片真假可以观察图中手指数量是否正常、眼神是否怪异、发丝看起来是否真实等。生成的照片通常存在光影瑕疵,缺乏曝光等照片基本参数。也可以观察牙齿清晰与否,缺乏单个牙齿的轮廓可能是辨别深度伪造的一个线索。·更高效的方法是用AI对抗AI。
背景86岁的罗马教皇方济各大概不会料到,在他饱受支气管炎困扰的那些日子里,一张机器生成的图片让他成了时尚界的“顶流”。那件巴黎世家风格的白色羽绒服里包裹着的人仿佛是他,又不是他。一些人在社交平台上留言称,他们已无法判断何为真实、何为虚构。