资料图:高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上,有委员提出,应重视当前国内人工智能(AI)大模型产业发展中遇到的高质量中文语料数据短缺问题。
2月20日晚间,复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS,引发各界人士参与内测的热情。一个显著的反馈是,MOSS的英文回答水平比中文高,这在公众与ChatGPT的互动中也有类似体现。为何如此?
LLAMA2吞吐量估算公式:total tokens / ,根据Llama 2: Open Foundation and Fine-Tuned Chat Models论文:1)7B的total tokens为2.0 T, total GPU hours 为184320,代入公式得3014 Tokens/sec/GPU;
6月15日,搜狗创始人王小川创立的百川智能正式宣布推出了70 亿参数量的中英文预训练大模型——baichuan-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。
新民晚报讯 (记者 王蔚)无论你说普通话还是英语,它都能翻译成上海话。一款名为“小沪”的沪语大模型,昨天下午在第六届中国数字人文年会上亮相。作为上海大学打造数字城市“上海‘繁花’大模型”的组成部分,“小沪”致力于沪语的保护与发展。
5月18日,在2023天津世界智能大会上,科大讯飞董事长刘庆峰表示,旗下讯飞星火大模型将在10月24日实现对标ChatGPT,实现中文超越ChatGPT,英文相当于其水平。同时,刘庆峰表示,明年讯飞星火大模型达到GPT-4相应水平。
On August 29, the world's first professional, multimodal large language model for the field of lunar science has been released at the China International Big Data Industry Expo.