参考消息网1月29日报道据新加坡《联合早报》网站1月28日报道,中国初创企业深度求索(DeepSeek)公布低成本大模型后,除夕当天(1月28日)再发布开源文字生成图像(文生图)大模型Janus-Pro 7B,该模型在基准测试中超越美国巨头OpenAI。
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
导读近几日,深度求索(DeepSeek)推出的DeepSeekR1模型在科技圈引发了轩然大波,尤其是它的API服务价格竟然远低于OpenAI的o1,性价比之高让人惊叹。到底这个新模型有多牛?为什么连顶尖教授都对它赞不绝口?这背后又隐藏着怎样的行业变革?快来一起看看!
AI永不眠。 由于DeepSeek的R1大语言模型引发了华尔街对于美国公司模型成本的质疑,以及人工智能股票泡沫破裂的恐慌,美股掀起科技股抛售潮。芯片巨头英伟达当日收盘股价暴跌约16.86%,单日市值蒸发约6000亿美元,博通下跌17.4%,超威半导体公司下跌6.
北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。
DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论还在持续。热议的焦点在于,当开源模型能力赶上最新的闭源模型,可能改变大模型的竞争格局。