FLA

All

6 repositories

flash-linear-attention
Public
🚀 Efficient implementations of state-of-the-art linear attention models in Torch and Triton
natural-language-processing machine-learning-systems large-language-models
Python
•
MIT License
•135•2.2k•23•2•Updated Mar 24, 2025Mar 24, 2025
fla-zoo
Public
Flash-Linear-Attention models beyond language
computer-vision flash-linear-attention
Python
•1•9•0•0•Updated Mar 23, 2025Mar 23, 2025
flame
Public
🔥 A minimal training framework for scaling FLA models
sequence-modeling large-language-models flash-linear-attention
Python
•
MIT License
•14•82•0•0•Updated Mar 22, 2025Mar 22, 2025
native-sparse-attention
Public
🐳 Efficient Triton implementations for "Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention"
Python
•
MIT License
•29•588•7•0•Updated Mar 19, 2025Mar 19, 2025
flash-hybrid-attention
Public
0•7•0•0•Updated Mar 5, 2025Mar 5, 2025
flash-bidirectional-linear-attention
Public
Triton implement of bi-directional (non-causal) linear attention
computer-vision machine-learning-systems triton-lang
Python
•
MIT License
•1•44•0•0•Updated Feb 4, 2025Feb 4, 2025