danielcherubini · danielcherubini · Jun 13, 2026 · Jun 13, 2026 · Jun 13, 2026 · Jun 13, 2026
diff --git a/crates/tama-cli/src/commands/model/create.rs b/crates/tama-cli/src/commands/model/create.rs
@@ -65,6 +65,7 @@ pub(super) async fn cmd_create(
         model: Some(model_id_arg.to_string()),
         quant: quant_name.clone(),
         mmproj: None,
+        mtp_model: None,
         port: None,
         health_check: None,
         enabled: true,

diff --git a/crates/tama-cli/src/commands/model/pull.rs b/crates/tama-cli/src/commands/model/pull.rs
@@ -350,6 +350,7 @@ pub(crate) fn cmd_scan(config: &Config) -> Result<()> {
                                 enabled: true,
                                 selected_quant: None,
                                 selected_mmproj: None,
+                                selected_mtp_model: None,
                                 context_length: None,
                                 gpu_layers: None,
                                 port: None,
@@ -510,6 +511,7 @@ mod tests {
             enabled: true,
             selected_quant: None,
             selected_mmproj: None,
+            selected_mtp_model: None,
             context_length: None,
             gpu_layers: None,
             port: None,
@@ -573,6 +575,7 @@ mod tests {
             enabled: true,
             selected_quant: None,
             selected_mmproj: None,
+            selected_mtp_model: None,
             context_length: None,
             gpu_layers: None,
             port: None,
@@ -628,6 +631,7 @@ mod tests {
                 enabled: true,
                 selected_quant: None,
                 selected_mmproj: None,
+                selected_mtp_model: None,
                 context_length: None,
                 gpu_layers: None,
                 port: None,
@@ -675,6 +679,7 @@ mod tests {
                 enabled: true,
                 selected_quant: None,
                 selected_mmproj: None,
+                selected_mtp_model: None,
                 context_length: None,
                 gpu_layers: None,
                 port: None,
@@ -714,6 +719,7 @@ mod tests {
                 enabled: true,
                 selected_quant: None,
                 selected_mmproj: None,
+                selected_mtp_model: None,
                 context_length: None,
                 gpu_layers: None,
                 port: None,

diff --git a/crates/tama-cli/src/handlers/server/add.rs b/crates/tama-cli/src/handlers/server/add.rs
@@ -145,6 +145,7 @@ pub async fn cmd_server_add(
         model: extracted.model.clone(),
         quant: quant_name,
         mmproj: None,
+        mtp_model: None,
         port: extracted.port,
         health_check: None,
         enabled: true,

diff --git a/crates/tama-cli/tests/tests.rs b/crates/tama-cli/tests/tests.rs
@@ -256,6 +256,7 @@ async fn test_cmd_server_edit_valid_profile_succeeds() {
             model: None,
             quant: None,
             mmproj: None,
+            mtp_model: None,
             port: None,
             health_check: None,
             enabled: true,

diff --git a/crates/tama-core/src/config/resolve/mod.rs b/crates/tama-core/src/config/resolve/mod.rs
@@ -303,6 +303,49 @@ impl Config {
             }
         }
 
+        // Inject --spec-draft-model from model card, only if:
+        // 1. mtp_model is set
+        // 2. The referenced quant has kind = Mtp
+        // 3. draft-mtp is in spec_decoding.spec_types (user enabled it)
+        // No backend gate — mirrors --mmproj; silently ignored by non-llama.cpp
+        // backends if they don't recognise the flag.
+        if let (Some(ref model_id), Some(ref mtp_name)) = (&server.model, &server.mtp_model) {
+            let has_draft_mtp = server
+                .spec_decoding
+                .spec_types
+                .iter()
+                .any(|t| t == "draft-mtp");
+            if has_draft_mtp {
+                if let Some(mtp_entry) = server.quants.get(mtp_name.as_str()) {
+                    if mtp_entry.kind == crate::config::QuantKind::Mtp {
+                        let models_dir = self.models_dir()?;
+                        let mtp_path = repo_path(&models_dir, model_id).join(&mtp_entry.file);
+                        let already_has_draft = grouped.iter().any(|e| {
+                            matches!(crate::config::flag_name(e), Some("--spec-draft-model"))
+                        });
+                        if !already_has_draft {
+                            let path_str = mtp_path.to_string_lossy();
+                            let quoted = crate::config::quote_value(&path_str);
+                            grouped.push(format!("--spec-draft-model {}", quoted));
+                        }
+                    } else {
+                        tracing::warn!(
+                            "mtp_model '{}' for model '{}' has kind={:?}, expected Mtp",
+                            mtp_name,
+                            model_id,
+                            mtp_entry.kind
+                        );
+                    }
+                } else {
+                    tracing::warn!(
+                        "mtp_model '{}' not found in ModelConfig for model '{}'",
+                        mtp_name,
+                        model_id
+                    );
+                }
+            }
+        }
+
         // Inject -c (context length) only if not already present.
         let ctx = ctx_override.or(server.context_length).or_else(|| {
             server