閱讀(444) 書簽贊(0) 我要糾錯

CodeGeeX4-ALL-9B評測結(jié)果：性能卓越的代碼生成模型

2025-01-07 10:26 更新

評測結(jié)果

CodeGeeX4-ALL-9B 被評為參數(shù)量100 億內(nèi)的最強模型，甚至超越了參數(shù)量大幾倍的通用模型，在推理性能和模型能力之間達到了最佳效果。

點擊圖片可查看完整電子表格

在 BigCodeBench 的 complete 和 instruct 任務中，CodeGeeX4-ALL-9B 分別取得了 48.9 和 40.4 的高分，這在參數(shù)量 200 億內(nèi)的模型中是最高的分數(shù)。

NaturalCodeBench測試結(jié)果顯示，CodeGeeX4-ALL-9B在代碼補全、代碼解釋器、代碼問答、代碼翻譯、代碼修復等任務上均取得了最佳效果：

Crux-Eval 是測試代碼推理、理解和執(zhí)行能力的基準測試，借助于其強大的 COT 能力，CodeGeeX4-ALL-9B 展現(xiàn)出色的表現(xiàn)。在 HumanEval、MBPP 和 NaturalCodeBench 等代碼生成任務中，CodeGeeX4-ALL-9B 也取得了出色的成績。目前，它是唯一支持 Function Call 功能的代碼模型，甚至取得了比 GPT-4 更高的分數(shù)。