大模型源码用什么语言写的

资讯

研究完llama.cpp，我发现手机跑大模型竟这么简单
我们知道，除了通用化能力，大模型落地的关键在于推理性能的优化，然而如今这个优化程度超出了我们的预料。
机器之心Pro
11评论
大模型本质及趋势剖析，万字长文总结，让您玩转大语言模型
我在这里对大模型的技术最新发展、大模型本质及未来趋势进行探讨，因为水平有限，疏漏在所难免。GPT-4 All Tools:在一个 Chat 会话中同时使用多种工具，例如高级数据分析、网络冲浪和画图，无需再手动切换。
北方的郎
Redis 之父亲自上手用大模型撸代码：将来可以取代 99% 程序员
Redis 创始人 antirez 写下了自己 2024 年的第一篇博文，他从一名普通程序员的角度谈了谈对大语言模型的感受，虽然他的成就并不普通。
InfoQ
44评论
aiXcoder XL 智能编程大模型发布：自然语言一键生成方法级代码
如下图所示，aiXcoder XL 原本生成了一个调用了 isSorted 函数的 sort 方法。刘洋表示，“人类的创造潜能是无限的，aiXcoder 当前的工作目标是要帮助开发者，尽可能减少开发者的工作负担，让人们有更多的精力投入到更加富有创造性的工作中。
InfoQ
1评论
Meta语言大模型遭泄露，无意开启了GPT平替狂潮？
谁能想到，一场泄密事件，竟成了引发“ChatGPT平替”狂潮的开端。事情的最开端，是在今年2月24日，Meta发布大语言模型LLaMA（中文意为“羊驼”），因其参数量远小于GPT-3，效果却仍能优于后者一度在圈内引起热议。
南方都市报
49评论
量化巨头发布第一代大模型：免费商用，完全开源
量化巨头幻方开发的大模型来了！11月2日晚间，幻方宣布，探索AGI（通用人工智能）的新组织“深度求索（DeepSeek）”在成立半年后，发布第一代大模型——开源代码大模型DeepSeek Coder，已经开放内测，免费商用，完全开源。
澎湃新闻
47评论
终于有人从零到精通开始教大模型开发了！基于PyTorch与ChatGLM
本文包含的内容实在是太多了，一共有381页，这里小编就不做过多的介绍了，已经整理成册，需要的小伙伴，可以转发此文关注小编，私信小编【笔记】来进行获取!
程序员高级码农II
通信行业专题报告：开源竞速，AI大模型的“Linux时刻”降临
在与 GPT-3 的对比中，LLaMA-70 亿参数版在常识推理任务、零样本任务、自然问题和阅读理解中的表现与 GPT-3 水平相当，而 130 亿参数及更高参数的版本模型在以上领域的表现均优于 GPT-3。
未来智库
1评论
最强SQL代码生成大模型：超过GPT3.5的大模型SQLCoder，免费商用~
这是一个拥有150亿参数的模型，在自然语言到 SQL 生成任务上，其性能略微超过了 gpt-3.5-turbo，并且显著地超越了所有流行的开源模型。
数据学习DataLearner
30评论
讯飞星火大模型V4.0体验：全面进化，体验不输GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上，科大讯飞发布了讯飞星火大模型 V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。
IT之家
6评论

视频