Skip to content

项目简介 本项目是针对多模态大模型 Qwen2-VL-7B 的轻量化研究与实现

Notifications You must be signed in to change notification settings

donghong1/Multimodal-LLM-Lightweight

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

Multimodal-LLM-Lightweight

项目简介 本项目是针对多模态大模型 Qwen2-VL-7B 的轻量化研究与实现,目前是通过 AWQ(Activation-aware Weight Quantization)量化 和 VTW(Variable Token Width)方法,降低模型的计算和存储成本,同时保留模型的性能。 本项目的主要目标包括: 探索 AWQ 量化 在多模态大模型上的应用。 使用 VTW Token 缩减 技术进一步优化推理效率。 评估轻量化后的模型在多模态任务(如图文理解、问答等)上的性能表现

About

项目简介 本项目是针对多模态大模型 Qwen2-VL-7B 的轻量化研究与实现

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages