每秒500个tokens

资讯

大模型最快推理芯片一夜易主：每秒500tokens干翻GPU！
白交克雷西发自凹非寺量子位 | 公众号 QbitAI太快了太快了。一夜间，大模型生成已经没什么延迟了……来感受下这速度。眼花缭乱了吧，生成速度已经接近每秒500 tokens。还有更直观的列表对比，速度最高能比以往这些云平台厂商快个18倍吧。
量子位
245评论
一夜蒸发5600亿，英伟达真的危险了？｜钛媒体AGI深度
由于ChatGPT爆火引发 AI 算力需求热潮，英伟达 AI 芯片供不应求、大规模短缺。近两天，一家名为Groq的美国 AI 公司一夜“爆火”，主要因其自研的LPU芯片在 AI 推理技术上，通过优化架构和减少内存瓶颈，实现了高效率和低延迟，在处理大模型时的速度远超英伟达GPU，每秒生成速度接近500 tokens，而GPT-4仅40 tokens。
钛媒体APP
106评论
欧盟正式对TikTok启动调查
科技战略美国云安全工作组发布安全策略文件，提出优化政府云安全性的措施据MeriTalk网2月16日消息，由MITRE、云安全联盟、先进技术学术研究中心和 IT 采购咨询委员会四个非营利组织组成的云安全工作组于14日发布一份安全策略建议文件，向国会、白宫、联邦机构和行业提出建议施行
全球技术地图
3评论
逐浪AIGC丨生成式AI涌向终端高通欲做“铺路人”
21世纪经济报道记者白杨美国夏威夷报道北京时间10月25日，一年一度的高通骁龙峰会如期而至。以往，最新的旗舰手机芯片会是该峰会的主角，但今年，骁龙峰会呈现出令人瞩目的新变化。
21世纪经济报道
英伟达涉嫌违法被立案调查市值一夜蒸发6400余亿元
本报记者秦枭北京报道12月9日晚间，国家市场监督管理总局发布消息称，因英伟达公司涉嫌违反《中华人民共和国反垄断法》（以下简称《反垄断法》）及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》（市场监管总局公告〔2020〕第16号）
中国经营报
英伟达被“偷家”？全新AI芯片横空出世速度比GPU快十倍
《科创板日报》2月20日讯芯片推理速度较英伟达GPU提高10倍、成本只有其1/10；运行的大模型生成速度接近每秒500 tokens，碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天，一家名为Groq的初创公司在AI圈爆火。
科创板日报
197评论
炸裂！最新财季净利润同比增长769%，英伟达盘后股价直线拉升
北京时间2月22日，英伟达发布了再度翻倍增长的第四财季财报，2024年财年营收创历史新高609亿美元，增长126%。
证券时报e公司
万亿美元蜂拥AI芯片多方“围剿”英伟达
本报记者秦枭北京报道过去一年里，由ChatGPT引爆的AI浪潮愈演愈烈，英伟达（NASDAQ：NVDA）作为这场浪潮背后最大的“卖铲人”，其GPU芯片价格被炒高数倍，但市场上仍一卡难求，英伟达因此赚得盆满钵满。“英伟达不会永远在大规模训练和推理芯片市场占据垄断地位。
中国经营报
早新闻｜AI圈又有大消息，全新芯片横空出世
数据是个宝数据宝炒股少烦恼宏观热点住建部：214个城市已建立房地产融资协调机制住房城乡建设部表示，自1月份城市房地产融资协调机制工作部署以来，各地和相关金融机构紧锣密鼓抓好落实，不少城市春节假期仍在推进工作，协调机制落地见效持续取得新进展。
证券时报
彩票印刷业龙头，鸿博股份：布局AI，携手英伟达打造第二生长曲线
公司以安全印务为主营业务，是经国家保密局认定的秘密载体复制许可单位，拥有丰富的涉密产品生产管理经验，是中国彩票印刷行业的龙头企业之一，于2008年5月在深圳交易所中小企业板挂牌上市。
岱华智库
苹果M3芯片对于大模型的使用来说未来价值如何？结果可能不太好！
本文原文来自DataLeanreAI:苹果最新的M3系列芯片对于大模型的使用来说未来价值如何?由于苹果的统一内存架构以及它的超大内存，此前很多人发现可以使用苹果的电脑来运行大语言模型。
数据学习DataLearner
1评论
两会将至，应该重点关注哪些产业投资机会？——全球产业趋势跟踪周报（0226）
2)在化债背景下，大部分地方下调了固定资产投资增速目标，重庆、江西、广西等地下调幅度较大，或意味着中央需要更大程度的加强支出强度;
金融界
AI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕
作者 | ZeR0编辑 | 漠影芯东西2月21日报道，在OpenAI推出又一爆款力作AI视频生成模型Sora后，连带着偏上游的AI芯片赛道热度一点即着。创始成员来自谷歌TPU团队的美国存算一体AI芯片公司Groq便是最新赢家。
芯东西
46评论
史上最快大模型炸场！Groq一夜爆红，自研LPU速度碾压英伟达GPU
还没消化完Sora带来的震撼，又一家硅谷初创企业带着史上最快的大模型和自研芯片LPU霸占了热搜。根据2024年一月的测试结果，由Groq LPU驱动Meta Llama 2模型，推理性能遥遥领先，是顶级云计算供应商的18倍。
华尔街见闻
51评论
定价仅为GPT-4百分之一！幻方量化推“高性价比”大模型量化私募打响AI界价格战？
21世纪经济报道记者张梓桐上海报道量化私募机构正在高调入局大模型领域。
21世纪经济报道

加载更多

视频

问答

DAC小课堂第六期｜以太坊能否通过扩容延续神话？
头条问答

每秒500个tokens

资讯

大模型最快推理芯片一夜易主：每秒500tokens干翻GPU！

一夜蒸发5600亿，英伟达真的危险了？｜钛媒体AGI深度

欧盟正式对TikTok启动调查

逐浪AIGC丨生成式AI涌向终端 高通欲做“铺路人”

英伟达涉嫌违法被立案调查 市值一夜蒸发6400余亿元

英伟达被“偷家”？全新AI芯片横空出世 速度比GPU快十倍

炸裂！最新财季净利润同比增长769%，英伟达盘后股价直线拉升

万亿美元蜂拥AI芯片 多方“围剿”英伟达

早新闻｜AI圈又有大消息，全新芯片横空出世

彩票印刷业龙头，鸿博股份：布局AI，携手英伟达打造第二生长曲线

苹果M3芯片对于大模型的使用来说未来价值如何？结果可能不太好！

两会将至，应该重点关注哪些产业投资机会？——全球产业趋势跟踪周报（0226）

AI芯片黑马一夜爆红：成本推算争议不断，前员工现员工互撕

史上最快大模型炸场！Groq一夜爆红，自研LPU速度碾压英伟达GPU

定价仅为GPT-4百分之一！ 幻方量化推“高性价比”大模型 量化私募打响AI界价格战？

视频

groq：google发布推理速度超越GPU的LPU，推理可达每秒500 token

Vue源码mustache模板引擎-手写将tokens注入数据.mp4 进度

Tokens在Web3中的使用有几个原因：

17500 tokens on Brust of speed packs! 速度爆发

ChatGPT 4.0：高昂的使用成本让人望而却步，你怎么看？

Vue源码mustache模板引擎-底层tokens思想.mp4 进度

问答

DAC小课堂第六期｜以太坊能否通过扩容延续神话？

“每秒500个tokens”的最新推荐

“每秒500个tokens”的相关推荐

猜你喜欢

逐浪AIGC丨生成式AI涌向终端高通欲做“铺路人”

英伟达涉嫌违法被立案调查市值一夜蒸发6400余亿元

英伟达被“偷家”？全新AI芯片横空出世速度比GPU快十倍

万亿美元蜂拥AI芯片多方“围剿”英伟达

定价仅为GPT-4百分之一！幻方量化推“高性价比”大模型量化私募打响AI界价格战？