语言模型和推理模型

资讯

苹果发布语言模型OpenELM：基于开源训练和推理框架
来源：环球网【环球网科技综合报道】4月25日消息，苹果公司于日前发布一个名为OpenELM的高效语言模型，具有开源训练和推理框架。苹果方面表示，“大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。
环球网
3评论
旺精通~推理大语言模型综述：从系统1到系统2
旺精通：技术细节全解，深度精通技术基础大语言模型在快速决策方面表现不错，但在复杂推理任务中，因类似系统1推理模式，缺乏深度逻辑分析能力。重要意义在于推理大语言模型能够模仿系统2思维，实现更精准、审慎的推理，有助于推动人工智能迈向更高水平，解决以往模型难以处理的复杂任务。
旺知识
记者实测 | DeepSeek-R1对决四款主流推理模型：基础题意外“翻车”，高难度推理碾压ChatGPT o1
每经记者：岳楚鹏每经编辑：兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日，DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜，甚至超越了大众熟知的ChatGPT。
每日经济新闻
34评论
理解和使用语言模型的监督微调(SFT)
Decoder-only Transformers :这是大多数生成式 LLM 使用的 Transformer 架构的特定变体。直到最近提出 LLaMA-2 之前，开源 LLM 主要使用 SFT 对齐，RLHF 最少。
技术吧点亮未来星
6评论
密切跟进OpenAI，国产o1类推理模型陆续登场
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪2025年第一个月，国产o1类模型开始密集更新，发布者包括“六小虎”中的月之暗面、阶跃星辰，以及独立于创业公司格局外的DeepSeek。
界面新闻
3评论
推理模型创新大爆发，DeepSeek、千问、O3背后的基础技术科普
进入2025年，推理语言模型RLM开始大爆发。继OpenAI O1发布、DeepSeek火爆之后，包括X.ai、Anthropic、阿里千问、月之暗面在内的国内外大模型厂商纷纷跟进，最新的模型加速发布，前沿的创新算法不断涌现。
烽台望月
1评论

视频

问答