10月11日,星期五 03:45
火讯财经讯,10月11日消息,全链数据网络Chainbase近日宣布在HuggingFace开源其专为加密领域打造的大语言模型Theia-Llama-3.1-8B。该模型在困惑度(Perplexity)和BERT评分上均超越了市场主流模型,对crypto世界的理解能力超过大多主流开源大模型。 Chainbase团队独创性地构建了首个专业Web3数据集,收录了CoinMarketCap前2000项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用LoRA技术高效微调模型,并利用DeepSpeed等工具加速训练过程。此外,模型量化为Q8GGUF格式,大幅降低了内存占用,提升了推理速度。 据悉,Theia-Llama-3.1-8B是Chainbase在加密领域大模型的初步尝试且该模型已成功应用于ChainbaseDEMO交互应用TheiaChat,目前日活用户超过30万。