南都讯 记者李玲 数据质量决定了大模型的上限,但数据短缺成为制约大模型发展的瓶颈。如何缓解AI公司的数据焦虑?6月14日,第六届北京智源大会上公布了两个数据集:一是千万级高质量开源指令微调数据集,二是开源中英文行业数据集。高质量的指令数据是大模型性能的“养料”。
新京报贝壳财经讯(记者韦英姿)4月26日,在2024中关村论坛年会平行论坛“数据安全治理与发展论坛”上,北京智源人工智能研究院(简称智源研究院)副院长兼总工程师林咏华表示,从语言模型演进到多模态文生视频模型,对模型训练数据所需要的数据量提出了十倍、几十倍甚至上百倍的发展需求。
3月26日,美国商务部工业与安全局将北京智源人工智能研究院(简称“智源”)列入实体清单。智源研究院发布官方声明,称对于智源作为民办非营利科研机构被加入实体清单表示震惊,强烈反对这一毫无事实依据的错误决定,要求美国相关部门予以撤回。
10月30日消息,据IT之家报道,北京智源人工智能研究院(BAAI)推出了一款名为 OmniGen的新扩散模型架构。该模型是一种用于统一图像生成的多模态模型,能够处理多种图像生成任务,包括但不限于文本生成图像、图像编辑、主题驱动生成以及视觉条件生成等。
本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上的潜力。
北京商报讯(记者杨月涵)5月17日,智源研究院举办大模型评测发布会。现场北京商报记者获悉,在海淀区教委支持下,智源研究院联合与海淀区教师进修学校对齐学生测验方式,考察大模型与人类学生的学科水平差异,其中,答案不唯一的主观题,由海淀教师亲自评卷。
新京报讯(记者张璐)6月14日,第六届“北京智源大会”在中关村展示中心开幕,智源研究院院长王仲远做2024智源研究院进展报告。据悉,智源研究院探索生成式人工智能在分子生物学中的应用,研发全原子生物分子模型OpenComplex 2。智源研究院院长王仲远。
6月14日,智源研究院主办的“AI内行顶级盛会”——北京智源大会在中关村展示中心开幕。智源研究院院长王仲远汇报了智源研究院在语言、多模态、具身、生物计算大模型的前沿探索。在接受媒体采访时,王仲远表示,过去一年,国产大模型取得了长足进步。
2024年的国内大模型厂商在完成对OpenAI的技术祛魅后,借助开源平台,密集发布大模型产品,同时自带"打榜"动作,证明自身技术实力。在智源研究院院长王仲远看来,目前大模型行业百花齐放的同时,也面临良莠不齐的问题,"我自身作为AI研究者,有时也分不清楚到底哪个强哪个弱。
作为AI的前沿研究领域,具身智能已经成为今年一级市场最炙手可热的投资标的,在第六届北京智源大会期间,北京智源人工智能研究院院长王仲远接受《中国电子报》记者采访时表示, 对于当前具身智能/人形机器人领域空前高涨的投资热情,大家要客观理性地看待,一方面要能接受人形机器人发展可能在未来
北京商报讯(记者 魏蔚)6月18日,北京商报记者获悉,北京智源研究院打造的FlagEval天秤大模型评测平台实现了全面升级,并公布202406期FlagEval模型评测排行榜单。最新一期榜单显示,百度文心大模型4.0以89.
只需输入一段文字,电脑便会将其转化成栩栩如生的画面;只需问一句“哪里的饭好吃”,导航软件就能带你吃遍当地风味……大模型通常具有高度的通用性和广泛的适用性,已经在自然语言处理、图像识别和语音识别等众多领域大放异彩。然而,这仅是人工智能大模型应用的“冰山一角”。
10月21日,北京智源研究院发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,能够更好地理解、模拟物理世界。“多模态是通向AGI(通用人工智能)的必由之路,人工智能要想进入物理世界,进入各行各业,必须建设一个‘大一统’的多模态模型。
最近,没有人不在讨论人工智能(AI)。刚开学,清华大学大模型与生成式AI课程的教室已经爆满,最后一排后方的空地站满了学生。不远处的中关村科技城在夜晚灯火通明,全国54%的大模型企业聚集于此,等待有志者加入。而在金融街或CBD走进一家咖啡馆或餐厅,总有人正在聊有关AI的投资机会。