在成本控制上,DeepSeek表现卓越,如训练参数量高达671b的deepseek - v3大模型,预训练仅用2048块gpu训练2个月,花费557.6万美元 ,相比GPT - 4等大模型,成本大幅降低,却能实现相当甚至更优的性能,在知识类任务、数学竞赛等测试中表现出色,生成速度也提升显著,从20tps大幅提高至60tps。
在科技飞速发展的当下,人工智能的触角正不断延伸到各个领域,就连风云变幻的股市也不例外。最近,一个令人瞩目的现象出现了 —— 用 DeepSeek 炒股的人开始涌现。这一新兴趋势,犹如一颗投入平静湖面的石子,在股市和科技领域激起了层层涟漪。
1月27日11点左右,DeepSeek官网一度显示“DeepSeek网页/API不可用”,功能现已恢复。昨日(26日),DeepSeek也“崩”了一次。DeepSeek随后回应称,1月26日下午DeepSeek确实出现了局部服务波动,但问题在数分钟内得到解决。