谷歌Transformer

资讯

谷歌新架构一战成名，打破Transformer记忆瓶颈，姚班钟沛林新作
OpenAI 把它用在推理，谷歌这次把它用在了记忆。一作Ali Behrouz表示:Titans 比 Transformers 和现代线性 RNN 更高效，并且可以有效地扩展到超过 200 万上下文窗口，性能比 GPT4、Llama3 等大模型更好。
量子位
84评论
推Transformer革命之作！性能暴涨媲美Llama 2，推理能效大幅碾压
近日，谷歌DeepMind一口气推出两大新架构，在d基准测试中超越了Transformer。——如果真成了，就能跟「Attention Is All You Need」一样名留青史。
新智元
10评论
谷歌创始人重返一线敲代码
AI技术发展至今，谷歌一直被认为是人工智能领域的“黄埔军校”，近十年人工智能领域许多奠基性、开创性的工作均出自谷歌之手。
新黄河
黑匣子被打开了！Transformer可视化解释工具，本地运行GPT-2
2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。
机器之心Pro
能聊天、会干活看“机器大脑”如何赋能千行百业
人工智能可以说是当下最热的话题，人工智能大模型在语言、图片、视频生成等多领域所展现出来的各种能力，吸引了全世界的目光。一时间，大家都在谈论大模型。可能很多人会好奇，到底什么是大模型？为什么大模型能和我们聊天、回答我们的问题，还能生成图片和视频？
光明网
AI大模型的能力比拼或许不再拘泥于“堆算力”
来源：环球网【环球网科技综合报道记者秦耳】在如今大模型爆发的时期，拉住一个AI从业者问他市场上谁家的大模型更为优秀。他应该会告诉你“去看这家有多少算力投入训练”，更为言简的话他会以“存储有多少块英伟达算力芯片”作为更直接的衡量标准。
环球网
11评论
王坚亮相外滩大会：AI技术、机制和基础设施的革命，正在创造未来
来源：环球网【环球网科技综合报道】2024Inclusion·外滩大会今天上午在上海开幕。在开幕式主论坛上，中国工程院院士、之江实验室主任、阿里云创始人王坚分享了他对于AI、AI+和AI基础设施的思考。
环球网
引入AI基础设施，打造负责任的AI
引入AI基础设施，打造负责任的AI——专家热议人机共生未来在9月5日举行的2024外滩大会开幕式上，24岁的独臂男孩周键借智能仿生手演奏钢琴，在舞台上定格了温暖一幕。“人工智能虽然有很长的过去，却只有很短的历史。
光明网
谷歌前CEO怒斥员工“每周只来一天”、“卷”不过OpenAI，遭争议后火速道歉！
整理 | 郑丽媛出品 | CSDN（ID：CSDNnews）本周，斯坦福大学发布的一则视频引起许多热议：谷歌前首席执行官 Eric Schmidt 声称，谷歌之所以在 AI 方面落后于 OpenAI，主要是因为没人家“卷”。
CSDN
3评论
澳媒文章：全方位解读“天空”视频生成器
参考消息网2月22日报道澳大利亚“对话”网站2月20日刊登题为《什么是Sora？
参考消息
DeepSeek：迈向全社会分享的普遍智能
近期，杭州深度求索人工智能（AI）基础技术研究有限公司（DeepSeek）先后上线大语言基座模型DeepSeek V3，以及基于V3训练、专为复杂推理任务设计的DeepSeek R1模型，并同步开源。它们以卓越的性能超越或媲美了全球顶级的开源及闭源模型。
上观新闻
124评论
输入长度是GPT-4o的32倍，国产开源大模型突破瓶颈，迎接智能体时代
今天，上海稀宇科技公司（MiniMax）发布并开源了新一代01系列人工智能模型，包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。
上观新闻
17评论

加载更多

视频

在线举报