2018年以前,能够训练出一个适配特定任务的神经网络模型,对于深度学习领域的算法工程师而言难度很大。而进入大语言模型时代后,通过几句简单的提示,普通人就可以完成同类任务。是什么让深度学习在这几年间发生了如此巨大的改变?为何当今主流大语言模型是GPT而不是其他神经网络结构呢?
为什么我们使用chatgpt问一个问题,回答时,他是一个字或者一个词一个词的蹦出来,感觉是有个人在输入,显得很高级,其实这这一个词一个词蹦不是为了高级感,而是他的实现原理决定的,下面我们看下为什么是一个一个蹦出来的。
21世纪经济报道记者孔海丽 实习生王甜 北京报道“人工智能有60多年的历史,大模型有6年的历史,也就占整个人工智能的发展历史的1/10,但这1/10才是真正的革命,AI认知智能、机器智能开始有真正的突破。