该公司成立于2023年,专注于开发先进的大语言模型和相关技术。DeepSeek模型以Transformer架构为基础,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络。
文:互联网江湖 作者:刘致呈眼看着梁文峰被捧上中国AI神坛,科技巨头们的心情一定是复杂的。就像大刘笔下的《三体》中,当三百年后的人类太空舰队,面对水滴探测器时是五味杂陈的。当科技大佬们纷纷断言,没有人能超过OpenAI,于是DeepSeeK横空出世,一众巨头面面相觑,慌不择路。