模型压缩-XMJoy 编程学院

文章目录▼CloseOpen量化压缩到底是什么？为什么能让手机AI变流畅？如何在压缩的同时保住90%以上的精度？实测效果如何？什么是AI模型量化压缩？它和普通压缩文件有区别吗？量化压缩后AI模型的...

4天前 1.13k

文章目录▼CloseOpen从技术层下手：用对方法，让模型“轻装上阵”模型压缩：把“大模型”变成“精模型”动态批处理：让GPU“不摸鱼”混合精度推理：“该省省，该花花”资源调度+场景适配：让算力“物尽其...

2周前 1.86k

文章目录▼CloseOpen模型压缩：给AI"减肥"的3个笨办法，亲测压缩70%还不丢准确率先从"骨架"下手：用轻量化网络设计替代"傻大黑粗"的通用模型再"抽脂"：量化+剪枝，去掉模型里的"赘肉"最后"补...

3周前 1.93k