Multimodal-LLM-Lightweight

项目简介本项目是针对多模态大模型 Qwen2-VL-7B 的轻量化研究与实现，目前是通过 AWQ（Activation-aware Weight Quantization）量化和 VTW（Variable Token Width）方法，降低模型的计算和存储成本，同时保留模型的性能。本项目的主要目标包括：探索 AWQ 量化在多模态大模型上的应用。使用 VTW Token 缩减技术进一步优化推理效率。评估轻量化后的模型在多模态任务（如图文理解、问答等）上的性能表现

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Qwen2-VL-7B-lighten		Qwen2-VL-7B-lighten
autoawq.egg-info		autoawq.egg-info
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multimodal-LLM-Lightweight

About

Releases

Packages

Languages

donghong1/Multimodal-LLM-Lightweight

Folders and files

Latest commit

History

Repository files navigation

Multimodal-LLM-Lightweight

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages