论文标题:Do Large Language Models Understand Conversational Implicature – A case study with a Chinese sitcom。
·国内大模型相比GPT-4还存在差距,推理、数学、代码、智能体是国内大模型短板,中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名(采用百分制)。商用闭源模型通过API形式测试,开源模型直接在模型权重上测试。
现阶段只支持 Mac 系统,Windows 版本要在今年晚些时候推出,发布桌面端其中一大亮点是可以直接共享电脑屏幕给 ChatGPT,实时在线,能随时帮你解决写代码、读图表等任务,且从演示视频看上去,桌面版 GPT 可以直接通过视觉等方式“读懂”你的任务,这大大提高了端侧任务处理的想象力。