1月29日8时至2月4日14时,永信至诚依托生成式人工智能(AIGC)加持的春秋AI测评“数字风洞”平台,基于“数字风洞”ISAC24测评标准,从智能度(Intelligibility)、安全度(Safety)、匹配度(Applicability)和一致度(Consistency
例如,在 AIME 2024 这类数学测试中,DeepSeek-R1-Zero 的 pass@1 准确率从 15.6% 飙升至 71.0%,通过多数投票策略还能进一步提高到 86.7%,水平可与 OpenAI-o1-0912 媲美。