1041 天前

06月13日,星期二 12:15

阿联酋打造的 Falcon-40B 语言模型在 OpenLLM 上排名第一,持续霸榜

火讯财经讯,据IT之家6月13日报道,近日,阿联酋科技创新研究所(TII)打造出了400亿参数的语言模型Falcon-40B,在HuggingFace的OpenLLM排行榜上排名第一,并持续霸榜,赢过此前LLaMA、StableLM和RedPajama等竞争者。据称,Falcon-40B使用了384颗GPU来进行2个月的训练、利用将近5亿个Token训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给AI模型训练。经多个基准测试,表现比LLaMA、Vicuna和Alpaca更加出色。此外,团队还采用了“多重查询注意力”(Multiqeryattention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个Token进行多个查询,来更好表示同一序列中,不同token之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。阿联酋科技创新研究所首席执行官RayO.Johnson博士表示:“2023年将是人工智能之年。Falcon模型对我们来说具有里程碑意义,但这仅仅是个开始”。

0
0
  • 霍尔木兹海峡 4 月 19 日无船舶通行记录

    火讯财经讯,据美国方面消息,基于船舶追踪数据,截至英国时间19日下午,霍尔木兹海峡当日未观测到任何船舶通行记录。18日至少13艘油轮在尝试驶离波斯湾过程中改变航向并掉头返航,放弃继续通过该海峡。

    16 分钟前

  • 数据:若 ETH 突破 2,453 美元,主流 CEX 累计空单清算强度将达 7.54 亿美元

    火讯财经讯,据Coinglass数据显示,若以太坊(ETH)突破2453美元,主流中心化交易所的累计空单清算强度将达到7.54亿美元;反之,若ETH跌破2220美元,主流CEX的累计多单清算强度将达到4.81亿美元。

    31 分钟前

  • 数据:若 BTC 跌破 72,140 美元,主流 CEX 累计多单清算强度将达 9.73 亿美元

    火讯财经讯,据Coinglass的数据显示,若比特币跌破72140美元,主流加密货币交易所累计多单清算强度将达9.73亿美元;反之,若比特币突破79349美元,主流加密货币交易所累计空单清算强度将达9.52亿美元。

    32 分钟前

  • DefiLlama 创始人:目前无 WETH 头寸面临即时清算风险

    火讯财经讯,DefiLlama创始人0xngmi在X平台发文称,当前无WETH头寸面临即时清算风险,weETH在Aave上接近清算价格,但所有这些贷款均以ETH作为抵押,因此安全,除非利率急剧上升。

    1 小时前

  • 特朗普:万斯将不参加美伊复谈

    火讯财经讯,美国总统特朗普在4月19日接受采访时表示,出于安全原因,美国副总统万斯将不会参加美伊再次谈判。特朗普称,美国特使威特科夫和库什纳将于美东时间4月20日晚抵达巴基斯坦首都伊斯兰堡,参与定于4月21日举行的美伊谈判。

    1 小时前