北京商报讯(记者 何倩 乔心怡)12月25日,根据值得买在互动平台中的官方回应,北京商报记者了解到,值得买的消费大模型基于通用大模型的技术底座,正处于结合公司积累的私有数据进行训练和调优的阶段。值得买表示,目前该模型已经在公司产品或者正在测试的产品中发挥作用。
9月6日,2024界面REAL科技大会上,深势科技生命科学事业部总经理李小兵在“AI+医疗”主题圆桌对话中表示,大模型领域,现在GPT更像一个“文科生”,而在AI for Sicence这个赛道上,需要回答的更多是科学性的问题。
在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。11月23日,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架的2.6倍,千亿级大模型训练可节省50%算力成本。
7月5日,在2024世界人工智能大会(WAIC)上,中国太保举办以“智造数字劳动力,打造新质生产力”为主题的高端保险论坛。中国太保副总裁俞斌在论坛上表示,金融业作为数字化需求强烈的数据密集型行业,已成为人工智能发力的重要场景之一,金融业的数字化升级,已经进入到数智化阶段。
来源:环球网 【环球网科技综合报道】近日,国内知名的GPU企业摩尔线程与领先的数据智能服务商滴普科技联合宣布,摩尔线程的夸娥(KUAE)千卡智算集群已成功与滴普科技的企业大模型Deepexi完成训练及推理适配。
字节跳动大模型训练被“投毒”近日,有消息称字节跳动发生大模型训练被实习生“投毒”事件。据悉,该事件发生在字节跳动商业化团队,因实习生田某某对团队资源分配不满,利用HF(huggingface)的漏洞,通过共享模型注入破坏代码,导致团队模型训练成果受损。
今年以来,越来越多国内银行积极拥抱大模型技术,并将其广泛应用在众多金融场景。与之同时,算力瓶颈正成为布局大模型技术的一大挑战。“算力的基础,是先进的AI芯片。但由于美国限制对华出口先进的AI芯片(包括GPU芯片),国内银行在研发金融大模型方面普遍遇到算力瓶颈。
在WAIC2023的展馆现场, 30多个大模型在每一家的展台上都能完美呈现,仅仅根据呈现的任务处理能力,很难分辨它们本质的不同。“也不需要把一些过程想得太复杂,当你选择继续生成或者重新生成,这本身就是对大模型的一种反馈,告诉它‘这次你做得可能不够好,要继续调整’。
7月14日,华为发布大模型时代AI存储新品,为基础模型训练、行业模型训练,细分场景模型训练推理提供存储最优解,释放AI新动能。两款新品分别是OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。
封面新闻记者 杨霁月算力已成为数字经济时代的关键生产力,是全社会数字化、智能化转型的重要基石。当前,算力基础设施正由以通用算力为主向通用算力、智算、超算一体化演进,智算中心作为新型算力公共基础设施,将为以人工智能为代表的新一轮科技革命和产业变革注入强劲动力。