蒙特卡洛搜索

资讯

PyTorch简单的AlphaZero的算法（2）：理解和实现蒙特卡洛树搜索
Silver， D.， Hubert， T.， Schrittwieser， J.， Antonoglou， I.， Lai， M.， Guez， A.， Lanctot， M.， Sifre， L.， Kumaran， D.， Graepel， T.， Lillicrap， T.， Simonyan， K.， & Hassabis， D. . A general reinforcement learning algorithm that Masters Chess， Shogi， and go through self-play. Science， 362， 1140–1144. 见原文链接。
deephub
2评论
ResNet作者张祥雨，投身AI大模型
衡宇西风发自凹非寺量子位 | 公众号 QbitAI大模型的人才黑洞效应，还在持续。量子位获悉，最新出现在大模型大牛转会名单上的重磅大牛，是90后AI大牛张祥雨，ResNet四位作者之一，孙剑首位深度学习博士生，未来科学大奖得主。
量子位
7评论
如何泛化AI的深度推理能力？
编者按：大语言模型的推理能力一直是人工智能领域的研究热点，但传统依赖大规模数据和参数扩展的预训练方式在提升模型推理能力上逐渐遇到了瓶颈。
微软亚洲研究院
小模型的数学能力更强？微软新方法挑战参数越大模型越好传统观点
人们往往认为大语言模型更擅长做数学题，事实上小语言模型也能做数学题甚至做得更好。1 月 8 日，由微软亚洲研究院团队领衔的一篇论文在 arXiv 上线。
DeepTech深科技
人工智能帮助发现新型候选抗生素
新华社北京1月1日电美国麻省理工学院近日发布新闻公报说，该校研究人员参与的国际团队利用人工智能深度学习模型，发现了可治疗耐药细菌感染的新型化合物。这些化合物有潜力成为新型抗生素药物。麻省理工学院和哈佛大学等机构研究人员首先测试了约3.
新华网
1评论
一文详解“最强大脑”BPU以及智能驾驶应用开发套件TROS·A | 地平线「你好，开发者」上海车展特别活动全程实录
4月21日，地平线「你好，开发者」上海车展特别活动在「智东西公开课」的联合视频直播顺利完结。本次活动邀请到地平线算法平台总架构师穆黎森、地平线软件平台总架构师宋巍两位技术专家，分别以《详解BPU-智能机器人时代“最强大脑”》、《TROS·A如何支持智能驾驶从Demo走到量产开发》为主题展开了分享。
车东西
兰德公司发布《美国全球卫生工作在亚洲的未来》报告
科技战略美国务院发布新的《国家适应和恢复规划战略》，提高应对气候变化的能力据美国务院1月10日消息，美国当日发布新的《国家适应和恢复规划战略》，提出灾害救援、保护商业投资和经济、维护国家安全、确保国家更健康未来所需的蓝图和一系列关键步骤，同时指导各州和地方采取适应行动。
全球技术地图
P/NP问题50年：基础理论举步维艰，但AI正在不可能中寻找可能
核心观点:1. 至2021年，P/NP问题已经50岁了，但其解决方案仍遥不可及。随着我们持续地在机器学习以及以数据为中心的计算领域取得激动人心的进步，P/NP问题向我们提供了一个宝贵的视角，去了解在未来的机器学习领域什么是可能的，什么是不可能的。
返朴
7评论
AI 驱动科学大爆发！从蛋白质到数学证明，2024 年最值得关注的科技
其一是诺贝尔化学奖，颁发给了在蛋白质设计与蛋白质结构预测领域做出开创性贡献的 David Baker 博士、John Jumper 博士以及Demis Hassabis 博士;
ScienceAI
1评论
全网最全 OpenAI o1 万字综述：创新、原理和团队
前段时间 OpenAI 发布了针对复杂推理问题的大模型——o1，也就是草莓模型。Ilya 一句话概括强化学习:让 AI 用随机的路径尝试新的任务，如果效果超预期，那就更新神经网络的权重，使得 AI 记住多使用这个成功的事件，再开始下一次的尝试。
人人都是产品经理
6评论
科普之窗 | AI 驱动科学大爆发！从蛋白质到数学证明，2024年最值得关注的科技突破
其一是诺贝尔化学奖，颁发给了在蛋白质设计与蛋白质结构预测领域做出开创性贡献的 David Baker 博士、John Jumper 博士以及Demis Hassabis 博士;
创新内蒙古

加载更多

视频