lm 大模型

资讯

LM Studio: 跨平台本地运行开源大模型
LM Studio还有一个使用 Multi Model 模式，通过加载多个模型来一起工作，因本地RAM限制这里就不做尝试了。
ChatGPT扫地僧
4评论
面向大模型的可信智算服务要求（LM-TIC）评估启动！
随着人工智能技术的飞速发展，智算服务已成为推动产业数字化转型和技术创新的关键力量。国家层面高度重视智算基础设施的建设和应用，加速智算服务的普及与推广。
澎湃新闻客户端
技术干货！LLM工程师必读量化指南，可视化揭秘大模型如何压缩
编辑：编辑部【新智元导读】面对LLM逐渐膨胀的参数规模，没有H100的开发者和研究人员们想出了很多弥补方法，「量化」技术就是其中的一种。这篇可视化指南用各种图解，将「量化」的基本概念和分支方法进行了全方位总结。大语言模型（LLM）通常过于庞大，无法在消费级硬件上运行。
新智元
12评论
时间序列大模型（LTM，Large Time Series Model）来了：Moirai简介
在计算机视觉和自然语言处理领域，基础大模型已经展现了强大的能力。论文题目: 《Unified Training of Universal Time Series Forecasting Transformers 》地址链接: 见原文链接。
新语数据故事汇
39评论
一个开源的多模态大模型：InternLM-XComposer
InternLM-XComposer 项目是一个开源的大型视觉语言模型，支持长文本输入和输出，专注于图像和文本的理解与生成，具备多种应用场景，如视频理解、多轮多图对话、高分辨率图像理解、网页制作、文章创作等，并且在多个多模态基准测试中表现出色。
AI工具箱
2评论
20万张GPU！号称“地球上最聪明的AI”Grok-3来了，斩获多个Top1，网友：算力消耗是DeepSeek V3的263倍
北京时间 2 月 18 日中午，埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型，宣称其在数学、科学和编码基准测试中，击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 GPT-4o。
CSDN
680评论

视频