例如,最新的吵的沸沸扬扬的ruozhi吧数据也还不错的COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning,提供了一个高质量的中文数据集。
中新网广州5月13日电 (记者 蔡敏婕)随着人工智能技术的快速发展,大型语言模型已经成为近年来最受瞩目的技术之一。自年初以来,以ChatGPT为代表的对话式大型语言模型技术掀起AIGC(人工智能生成内容)浪潮,引发各领域广泛关注。智算时代,算力是生产力,数据是核心生产要素。
在国外大模型排名榜 Chatbot Arena 的基准测试里,DeepSeek-R1 的排名迅速攀升至全类别大模型第三,与 OpenAI 的 ChatGPT-4o 最新版并肩,并且在风格控制类模型分类中,和 OpenAI 的 o1 模型并列第一。其预训练费用仅 557.6 万美元,在 2048 块英伟达 H800 GPU 集群上运行 55 天即可完成训练。
NAS行业,真的火了。信息咨询公司QYResearch调研报告显示,2029年全球消费级NAS市场规模将达到32.27亿美元,未来几年CAGR(年复合增长率)为45%。一个优质且高速增长的行业,势必吸引更多企业入场。