07月25日,星期二 10:45
火讯财经讯,据IT之家7月25日报道,北京知未智能科技有限公司日前在上海发布了知未智能KDF大模型,以及基于该模型研发的一系列产品,包括“KDF智讯”、“KDF绝未”、“KDF中书”等金融行业工具。据悉,知未智能KDF大模型的训练数据以中文为主,并包含大量的金融数据,以提升模型在商业和金融领域的问题处理能力。此外,训练数据中还融合了部分英文与代码数据,以适应模型的通用能力。在训练过程中,知未智能KDF大模型将单个汉字视为独立的Token进行处理。模型参数量达1400亿,训练Token数达到4000亿。知未智能科技CEO段清华表示,现有通用大模型在具体行业应用性和中文能力方面的局限是知未智能选择从零训练知未智能KDF大模型的主要原因,Chatglm在具体行业应用能力上相对薄弱,MOSS采用英文模型为基底而对中文支持不足,LLaMA训练数据大多为英文数据而中文能力相对较弱了,因此研发团队选择从零开始训练知未智能KDF大模型,以便更好地提升其中文能力以及行业适用性。