这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。 BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions。