◎2024年刚刚开始,自研架构的进一步涌现给新一年的大模型赛道带来了更多的不确定性和新的可能性。Yan架构的大模型去除了Transformer中高成本的注意力机制,代之以计算量更小、难度更低的线性计算,提高了建模效率和训练速度,实现了效率的提升和成本的降低。
经历了被称为“大模型元年”的2023年,落地应用,也自然成为2024年行业关注的焦点,各家都在摩拳擦掌积极布局。作为上海岩山科技股份有限公司旗下的科技创新型人工智能企业,上海岩芯数智人工智能科技有限公司(以下简称“岩芯数智”)也是其中之一。
2024年1月,公司旗下岩芯数智已在上海发布了完全自主研发的Yan 1.0大语言模型,该模型是国内首个非Attention机制的大模型,同时也是国内领先的非Transformer架构大模型,Yan 1.0以自然语言为主。
5月13日,上海市委网信办发布《上海市生成式人工智能服务已备案信息公告(5月13日)》,公布上海市新增4款已完成备案的生成式人工智能服务,上海岩芯数智人工智能科技有限公司(以下简称“RockAI”)的大模型位列其中。截至目前,上海市仅有28个大模型通过了这一重要备案。
继续上回没说完的,公司第二条赛道就是目前火热的人工智能,其实人工智能和智能驾驶是有点相互成就的,因为自动驾驶现在都有用到大模型,公司的人工智能叫ROCK AI,大模型用的YAN架构,到今天为止市面上大模型真是太多了,互联网型的公司基本上人手一个,但是他们家模型和其它家还是点不一样的,架构不一样,Transformer作为GPT、LLaMA等大模型的基础架构,仍有算力消耗等缺陷。
21世纪经济报道记者 张赛男 上海报道2024年以来,此前密集涌现的大模型陆续进入商业化探索,谁能跑通“最后一公里”,才算进入了真正的竞争。9月26日,岩山科技旗下公司岩芯数智在上海举行开放日活动,正式推出全新升级的Yan1.
本报记者 施露1月24日,上海岩芯数智人工智能科技有限公司(下称“岩芯数智”)发布Yan架构通用大模型。据岩芯数智CEO刘凡平介绍,Transformer作为GPT、LLaMA等大模型的基础架构,仍有算力消耗等缺陷。
中新网上海新闻1月25日电(高志苗)大模型的讨论,2024年开年热度不减。24日,岩芯数智召开“新架构,新模力”大模型发布会,正式发布了通用自然语言大模型——Yan模型。“新架构,新模力”大模型发布会现场。