10月19日,星期四 05:45
火讯财经讯,据IT之家消息,10月19日,北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行AI实验室正式开源旗下70亿参数的代码大模型CodeShell,号称“同等规模最强代码基座”。据悉,CodeShell-7B基于5000亿Tokens进行了冷启动训练,上下文窗口长度为8192,架构设计上融合了StarCoder和Llama两者的核心特性。在代码评估基准HumanEval和MBPP中,CodeShell超过了CodeLlama-7B和StarCodeBase-7B,在humaneval的其它编程语言评测中,如JavaScript、Java、C++,CodeShell依然性能领先。