苹果与英伟达相助，AI模子运算速率栽植三倍

发布日期：2024-12-23 18:08 点击次数：143

外媒报谈，苹果最新机器学习本事，可将英伟达GPU产生领导速率栽植近三倍，更快为Apple Intelligence创建模子。

Appleinsider报谈，创建大型讲话模子 (LLM) 的要道，就在产生LLM成果低下，因机器学习查验模子自身即是资源密集且缓缓的经由，只可用更多硬件及增多动力资本排斥残障。

本岁首苹果发布Recurrent Drafter，是栽植推测查验发达的解码法。合并搜索和动态树RNN（轮回神经集合）草稿模子，揣测考据多旅途草稿标志，与典型自转头领导生成比拟，可将每生成步调LLM领导产生速率栽植3.5倍。

苹果机器学习网站著述，诠释注打消了使用Apple Silicon现存任务，并莫得罢手，新叙述注释先容奈何诈骗此参谋创建ReDrafter，与英伟达GPU扫数出产。英伟达GPU频繁用于LLM就业器，但高性能硬件资本腾贵，单多GPU就业器硬件资本就跳动25万好意思元，更无须说其他基础步调或聚会资本。

苹果与英伟达相助，将ReDrafter集成至英伟达TensorRT-LLM推理加快框架。ReDrafter使用其他推测解码，英伟达必须添加独特元素能力平淡初始。集成后使用GPU的ML竖立东谈主员，当今可用TensorRT-LLM进行出产时使用ReDrafter的加快领导生成，而不单用Apple Silicon的竖立东谈主员。英伟达GPU基准测试数百亿个参数模子后，编码每秒产生速率栽植2.7倍。

结果是该经由可用于最大适度的减少用户的延伸，并减少所需的硬件数目。简而言之，用户不错生机从以云揣摸为主的查询中取得更快的结果，而公司不错在粉碎更少的情况下提供更多就业。而显卡出产商暗示，这次相助使TensorRT-LLM更弘大、更无邪，也使得LLM社外交媒体够革命更复杂的模子，并松驰部署它们。”

(首图开端：Pixabay)

上一篇：12月18日创业板成长ETF易方达（159597）份额减少60.00万份，最新份额9045.24万份，最新边界1.10亿元

下一篇：冰雪别传（骑战版）

热点资讯

一、房地产的基础主见与范围房地产，当作经济畛域中至关舛误的一部分，泛泛有广义和狭义之分。狭义上，它涵盖了地皮、建筑物终点附属物，包括这些物资实体所承载的各种权益。而广义...

让建站和SEO变得简单

苹果与英伟达相助，AI模子运算速率栽植三倍

热点资讯

相关资讯