·在业内人士看来,和国内其他大模型创业公司相比DeepSeek是幸运的,没有融资压力,不需要向投资人证明,不需要兼顾模型的技术迭代和产品应用的优化。但作为一家商业公司,巨资投入后,或早或晚都要面临目前其他模型公司面临的压力和挑战。2024年中国大模型圈最火的是哪家?
deepseek在1月20号推出AI模型R1,此模型可与OpenAI的ChatGPT媲美,开发成本远低于竞争产品,冲击了美国各大科技巨头以及科技股市,导致相关产业股票暴跌,英伟达股价暴跌约17%,博通公司股价下跌17%,超威半导体公司股价下跌6%,微软股价下跌2%。
8月2日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。在大模型API的使用场景中,如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。