欢迎来到华体会体育官网

黄先生:13553877099

hmr@mxjpm.com.cn

吴小姐:18928238486

wby@mxjpm.com.cn

华体会体育官网

五金模具

新闻资讯

联系我们

联系人: 黄先生

手机: 13553877099

电话:

黄先生:13553877099

hmr@mxjpm.com.cn

吴小姐:18928238486

wby@mxjpm.com.cn

邮箱: hmr@mxjpm.com.cn

地址:
横沥工厂:广东省東莞市横沥镇水边職教城高訓中心
常平工厂:广东省东莞市常平镇白花沥村六横路天图斯工业园第9栋101号

Snowflake推出SwiftKV技能显着提高AI模型推理功率

来源:华体会体育官网    发布时间:2025-04-12 05:20:07

  近来,研讨公司Snowflake发布了一项名为“SwiftKV”的AI模型调校技能,并在Hugging Face平台上开源了三款根据该技能调校的Llama 3.1 AI模型。SwiftKV技能的中心在于优化模型提示词处理进程,处理了大模型在处理用户输入提示词时耗费很多核算资源的问题。据Snowflake介绍,SwiftKV突破了传统的键值缓存紧缩技能,经过模型重组与常识保存自我蒸馏办法,显着提高了模型吞吐量,降低了推迟和运算本钱。试验成果为,运用SwiftKV技能优化后的Llama 3.1模型在代码主动补全和文本摘要等使命中表现出色,全体吞吐量提高了两倍,推理时刻减少了50%。