LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening Ming Zhang , Qiyuan Peng , Yinxi Wei , Yujiong Shen , Kexin Tan , Yuhui Wang , Zhenghao ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果