改编原文:Mohammad Ali Mirza, Mahtab Ghoroori, Zhangxin Chen. Intelligent Petroleum Engineering. Engineering,2022,18:27-32.
梦晨 发自 凹非寺量子位 | 公众号 QbitAI如果试题太简单,学霸和学渣都能考90分,拉不开差距……随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。