文档详情 ID: cmllr3ntmjsm0qspynovswtx9 后台管理 LLM 推理优化与部署实战 - 爱搜-网盘资源搜索-一站式网盘资源搜索,阿里夸克百度迅雷UC全聚合 file:3-12 介绍LLMCompressor量化工具【优质资源‖关注:cunWorkNotes 解锁】.mp4 file:1-24 模型压缩-AWQ针对PPL的实验结果【持续更新‖免费提供:CunworknoteS】.mp4 file:1-10 LLM推理基础-章节总结【耗时整理‖免费分享:Cunlove.cn】.mp4 file:3-7 模型量化脚本解析与校准数据集【整理不易‖免费奉上:cuNlove.cn】.mp4 file:2-5 测试vLLM部署的大模型【更多精选‖公众号:CunWorknotes】 .mp4 file:1-31 运行时加速方案-内容介绍【花费时间‖:cunLove.cn】.mp4 file:1-3 LLM推理基础-推理阶段与KVCache的关系_【花费时间‖:cunLove.cn】.mp4 file:1-36 运行时加速方案-FlashAttention切块和算子【耗时整理‖不易且全免费:cunlOve.cn】.mp4 file:3-9 测试量化之后模型查看返回结果【精挑细选‖免费提供:cunlovE.cn】.mp4 file:3-14 使用LLMCompressor对GPTQ-AWQ-NV【整理不易‖记得关注:CunWorKNotes】.tle file:1-9 LLM推理基础-优化思路-参数量化-运行时加速-IO优化【良心整理‖免费获取:cunloVe.cn】.mp4 file:1-4 LLM推理基础-生成KVCache过程推演_【不易整理‖请关注:CunWorkNoteS】.mp4 file:1-12 LLM性能指标-推理评估指标全景图【公重号:CunWorkNotes】.mp4 file:3-2 量化实战-思路与实战步骤讲解【整理不易‖记得关注:CunWorKNotes】.mp4 file:1-22 模型压缩-模型量化-参数存储空间的组成【耗时整理‖ cunlove.cn】.mp4 file:《LLM推理优化与部署实战》课件【花费时间‖:cunLove.cn】.pptx file:2-3 显卡驱动安装与配置【良心整理‖免费获取:cunloVe.cn】.mp4 file:3-10 介绍EvalScope与Perf命令组成【手动整理‖:cunlove.Cn】.mp4 file:1-37 运行时加速方案-PagedAttention原理解析【资源精选‖更多关注:CunworkNotes】.mp4 file:1-8 LLM推理基础-列举LLM存储介质以及如何搬运参数【精挑细选‖免费提供:cunlovE.cn】.tle file:02-量化实战-高级【手动整理‖:cunlove.Cn】.docx file:3-16 量化实战-课程总结_【公重号:CunWorkNotes】.tle file:01-vLLM推理实战【优质合集‖免费获取:cunlove.cN】.docx file:1-29 模型压缩-模型蒸馏分类和应用场景【优质合集‖免费获取:cunlove.cN】.mp4 folder:LLM 推理优化与部署实战 分享时间 2026-02-14 入库时间 2026-02-14 资源类型 夸克网盘 分享用户 乐于*人的黄鸭 扫码获取资源 问题反馈 链接失效、内容异常、密码错误等问题都可以快速提交。 选择举报类型 复制链接 进入网盘 分享资源