9月7日,2023腾讯全球数字生态大会在深圳宝安举行。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯将迈入“全面拥抱大模型”时代:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路。
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
5月21日,阿里云宣布,通义千问模型集体降价。降价后,1元最多买到200万tokens(模型数据的最小单元)!来源:阿里云微信公众号在阿里云宣布降价后,百度智能云再放“大招”。百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,立即生效。
阿里巴巴集团发布最新季度业绩披露,通义千问开源模型下载量已突破2000万,阿里云AI平台百炼的付费用户数,比上一个季度增长超过200%。该季度内阿里云发布了开源模型Qwen2-72B,该模型提升了代码、数学、推理、指令遵循、多语言理解等能力。
全网都在寻找DeepSeek官方的平替,其中硅基流动 是比较推荐的一个。作为一个完全开源的项目,除去UI设计、功能不谈,Cherry Studio很值得推荐的一点是作者活跃在各大平台、论坛,积极听取用户反馈的同时,更新相当及时。
·在产业化背景下,模型并非越大越好,模型越大能力越强,但使用成本也更高。因此从企业角度讲,要在满足一定效果之下尽可能降低成本。大模型价格降低有利于产业普及和推广,如果价格低于企业实际成本将扰乱市场。大模型企业应通过技术提升降成本,而不是仅仅为了占领市场。