OpenAI推出名为GPT-4o的新旗舰AI模型,GPT-4o增加了分析语音的功能,且能读取用户情绪。受此消息带动,A股MR头显、多模态模型、TWS耳机纷纷走强。信息技术ETF(562560)、5G通信ETF(515050)早盘冲高,盘中涨超1%。
今天凌晨,OpenAI 发布了 o1 系列模型,最大的特点是擅长推理。不过,对比 AIME 官方解答,o1-preview 的回答比较冗长——指望靠 GPT 开挂的中学生朋友,可别指望照抄,要自己思考呀。
·GPT-4可以接受图像和文本输入,而GPT-3.5只接受文本;GPT-4在各种专业和学术基准上的表现达到“人类水平”,在事实性、可引导性和可控制方面取得了“史上最佳结果”;当任务的复杂性达到足够的阈值时,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。
每经记者:岳楚鹏 每经编辑:兰素英1月20日发布的DeepSeek-R1模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
每经记者:岳楚鹏 每经编辑:兰素英OpenAI怎么也没想到,o3还在画饼阶段,中国一夜之间就冒出来两个能和o1打对台的模型。1月20日,月之暗面正式推出多模态思考模型Kimi k1.5,并首次公开该模型的训练技术报告。Kimi k1.
先看个Sora官方博客展示的demo,当你向Sora输入:“A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.”,Sora则根据该文本生成了长达1分钟的高清视频。
研究方向: 情感计算、人机语音交互、跨媒体数据建模与生成及数字人等。许多先前的工作使用各种方法研究了视频数据的生成建模,循环网络¹ ² ³、生成对抗网络⁴ ⁵ ⁶ ⁷、自回归Transformer⁸ ⁹和扩散模型¹⁰ ¹¹ ¹²。