财联社11月12日(编辑 牛占林)很多人工智能(AI)科学家和初创公司认为,通过增加更多数据和算力来扩大当前模型,以持续改进AI模型的方法正在走到尽头。因此,像OpenAI这样的AI公司正在寻求通过开发新的训练技术来克服当前面临的挑战,这些技术更像人类的思考方式。
在 BERT 之后,人们看到了大规模预训练的潜力,尝试了不同的预训练任务、模型架构、训练策略等等,在做这些探索之外,一个更加直接也通常更加有效的方向就是继续增大数据量和模型容量来向上探测这一模式的上界。
记者 | 张司钰编辑 | 倪 妮当开发者还在为OpenAI开放ChatGPT的API(应用程序编程接口)兴奋,铆足了劲研究各种AI插件之时,OpenAI在北京时间3月15日凌晨发布了多模态预训练大模型GPT-4(Generative Pre-trained Transformer
3月15日凌晨,OpenAI 发布多模态预训练大模型 GPT-4。AI浪潮席卷之下,国内大厂奋起直追,一天后,百度发布国内首款对标ChatGPT的产品“文心一言”,并在文学创作、商业文案创作、数理推算、中文理解、多模态生成等多个场景中展现了产品能力。