蒙特卡洛树搜索

资讯

PyTorch简单的AlphaZero的算法（2）：理解和实现蒙特卡洛树搜索
Silver， D.， Hubert， T.， Schrittwieser， J.， Antonoglou， I.， Lai， M.， Guez， A.， Lanctot， M.， Sifre， L.， Kumaran， D.， Graepel， T.， Lillicrap， T.， Simonyan， K.， & Hassabis， D. . A general reinforcement learning algorithm that Masters Chess， Shogi， and go through self-play. Science， 362， 1140–1144. 见原文链接。
deephub
2评论
如何泛化AI的深度推理能力？
编者按：大语言模型的推理能力一直是人工智能领域的研究热点，但传统依赖大规模数据和参数扩展的预训练方式在提升模型推理能力上逐渐遇到了瓶颈。
微软亚洲研究院
小模型的数学能力更强？微软新方法挑战参数越大模型越好传统观点
人们往往认为大语言模型更擅长做数学题，事实上小语言模型也能做数学题甚至做得更好。1 月 8 日，由微软亚洲研究院团队领衔的一篇论文在 arXiv 上线。
DeepTech深科技
人工智能帮助发现新型候选抗生素
新华社北京1月1日电美国麻省理工学院近日发布新闻公报说，该校研究人员参与的国际团队利用人工智能深度学习模型，发现了可治疗耐药细菌感染的新型化合物。这些化合物有潜力成为新型抗生素药物。麻省理工学院和哈佛大学等机构研究人员首先测试了约3.
新华社
1评论
创新算法助机器人实时选择理想路径
长沙晚报掌上长沙12月27日讯据科技日报消息美国加州理工学院科研团队开发了一种名为光谱扩展树搜索（SETS）的算法。该算法旨在帮助自主机器人在现实世界中导航时选择理想路径，并作出最佳决策和行动。这一创新成果近期刊登于《科学·机器人学》杂志封面。
长沙晚报掌上长沙
1评论
P/NP问题50年：基础理论举步维艰，但AI正在不可能中寻找可能
核心观点:1. 至2021年，P/NP问题已经50岁了，但其解决方案仍遥不可及。随着我们持续地在机器学习以及以数据为中心的计算领域取得激动人心的进步，P/NP问题向我们提供了一个宝贵的视角，去了解在未来的机器学习领域什么是可能的，什么是不可能的。
返朴
7评论
全网最全 OpenAI o1 万字综述：创新、原理和团队
前段时间 OpenAI 发布了针对复杂推理问题的大模型——o1，也就是草莓模型。Ilya 一句话概括强化学习:让 AI 用随机的路径尝试新的任务，如果效果超预期，那就更新神经网络的权重，使得 AI 记住多使用这个成功的事件，再开始下一次的尝试。
人人都是产品经理
6评论
兰德公司发布《美国全球卫生工作在亚洲的未来》报告
科技战略美国务院发布新的《国家适应和恢复规划战略》，提高应对气候变化的能力据美国务院1月10日消息，美国当日发布新的《国家适应和恢复规划战略》，提出灾害救援、保护商业投资和经济、维护国家安全、确保国家更健康未来所需的蓝图和一系列关键步骤，同时指导各州和地方采取适应行动。
全球技术地图
人工智能在IMO上的突破显示：大力仍可出奇迹
近日，DeepMind的AlphaProof/AlphaGeo在国际数学奥林匹克竞赛(IMO)中取得了前所未有的成绩，解出了六道问题中的四道获得银牌。
澎湃新闻
6评论
GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火
西风发自凹非寺量子位 | 公众号 QbitAI继Windows Copilot发布后，微软Build大会热度又被一场演讲引爆。
量子位
36评论
科普之窗 | AI 驱动科学大爆发！从蛋白质到数学证明，2024年最值得关注的科技突破
其一是诺贝尔化学奖，颁发给了在蛋白质设计与蛋白质结构预测领域做出开创性贡献的 David Baker 博士、John Jumper 博士以及Demis Hassabis 博士;
创新内蒙古

加载更多

视频

问答

蒙特卡洛树是什么算法？
蒙特卡洛树是指蒙特卡洛模拟树吗？是一种模拟人下棋的搜索算法吗？据说五子棋模拟只要简单枚举就可以模拟出来，而围棋却不行，有内行人懂吗？围棋究竟是怎么模拟的？
头条问答