swarmauri
diff --git a/‎pkgs/base/swarmauri_base/llms/LLMBase.py
+12-2 b/‎pkgs/base/swarmauri_base/llms/LLMBase.py
+12-2
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AI21StudioModel.py
+33-15 b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AI21StudioModel.py
+33-15
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AnthropicModel.py
+31-18 b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AnthropicModel.py
+31-18
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/CohereModel.py
+26-16 b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/CohereModel.py
+26-16
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepInfraModel.py
-1 b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepInfraModel.py
-1
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepSeekModel.py
+1 b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepSeekModel.py
+1
@@ -1,8 +1,9 @@
 from abc import abstractmethod
-from typing import Optional, List, Literal
-from pydantic import ConfigDict, model_validator, Field
+from typing import Dict, List, Literal, Optional
 
+from pydantic import ConfigDict, Field, PrivateAttr, SecretStr, model_validator
 from swarmauri_core.llms.IPredict import IPredict
+
 from swarmauri_base.ComponentBase import ComponentBase, ResourceTypes
 
 
@@ -13,6 +14,15 @@ class LLMBase(IPredict, ComponentBase):
     model_config = ConfigDict(extra="forbid", arbitrary_types_allowed=True)
     type: Literal["LLMBase"] = "LLMBase"
 
+    api_key: Optional[SecretStr] = None
+    name: str = ""
+    timeout: float = 600.0
+    include_usage: bool = True
+
+    # Base URL to be overridden by subclasses
+    BASE_URL: Optional[str] = None
+    _headers: Dict[str, str] = PrivateAttr(default=None)
+
     @model_validator(mode="after")
     @classmethod
     def _validate_name_in_allowed_models(cls, values):
 
@@ -1,12 +1,12 @@
 import asyncio
 import json
-from typing import AsyncIterator, Iterator, List, Literal, Type
+from typing import AsyncIterator, Iterator, List, Type
 
 import httpx
-from pydantic import PrivateAttr, SecretStr
+from pydantic import PrivateAttr
+from swarmauri_base.ComponentBase import ComponentBase
 from swarmauri_base.llms.LLMBase import LLMBase
 from swarmauri_base.messages.MessageBase import MessageBase
-from swarmauri_base.ComponentBase import ComponentBase
 
 from swarmauri_standard.conversations.Conversation import Conversation
 from swarmauri_standard.messages.AgentMessage import AgentMessage, UsageData
@@ -32,6 +32,7 @@ class AI21StudioModel(LLMBase):
     Provider resources: https://docs.ai21.com/reference/jamba-15-api-ref
     """
 
+
     api_key: SecretStr
     allowed_models: List[str] = ["jamba-1.5-large", "jamba-1.5-mini"]
     name: str = "jamba-1.5-large"
@@ -41,7 +42,6 @@ class AI21StudioModel(LLMBase):
     _BASE_URL: str = PrivateAttr(
         default="https://api.ai21.com/studio/v1/chat/completions"
     )
-    timeout: float = 600.0
 
     def __init__(self, **data) -> None:
         """
@@ -145,9 +145,12 @@ def predict(
         message_content = response_data["choices"][0]["message"]["content"]
         usage_data = response_data.get("usage", {})
 
-        usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
-
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -194,9 +197,12 @@ async def apredict(
         message_content = response_data["choices"][0]["message"]["content"]
         usage_data = response_data.get("usage", {})
 
-        usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
-
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -265,6 +271,15 @@ def stream(
 
         conversation.add_message(AgentMessage(content=message_content, usage=usage))
 
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
     @retry_on_status_codes((429, 529), max_retries=1)
     async def astream(
         self,
@@ -325,11 +340,14 @@ async def astream(
                 except json.JSONDecodeError:
                     pass
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(
         self,
 
@@ -1,6 +1,6 @@
 import asyncio
 import json
-from typing import AsyncIterator, Dict, Iterator, List, Literal, Type
+from typing import AsyncIterator, Dict, Iterator, List, Type
 
 import httpx
 from pydantic import PrivateAttr, SecretStr
@@ -32,7 +32,6 @@ class AnthropicModel(LLMBase):
     _BASE_URL: str = PrivateAttr("https://api.anthropic.com/v1")
     _client: httpx.Client = PrivateAttr()
     _async_client: httpx.AsyncClient = PrivateAttr()
-
     api_key: SecretStr
     allowed_models: List[str] = [
         "claude-3-7-sonnet-latest",
@@ -171,11 +170,15 @@ def predict(
             message_content = response_data["content"][0]["text"]
 
         usage_data = response_data["usage"]
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -254,10 +257,13 @@ def stream(
                             except (json.JSONDecodeError, KeyError):
                                 continue
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     @retry_on_status_codes((429, 529), max_retries=1)
     async def apredict(
@@ -296,11 +302,15 @@ async def apredict(
             message_content = response_data["content"][0]["text"]
 
         usage_data = response_data["usage"]
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -381,10 +391,13 @@ async def astream(
                             except (json.JSONDecodeError, KeyError):
                                 continue
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(
         self, conversations: List[Conversation], temperature=0.7, max_tokens=256
 
@@ -1,6 +1,6 @@
 import asyncio
 import json
-from typing import AsyncIterator, Dict, Iterator, List, Literal
+from typing import AsyncIterator, Dict, Iterator, List
 
 import httpx
 from pydantic import PrivateAttr, SecretStr
@@ -47,7 +47,6 @@ class CohereModel(LLMBase):
     type: Literal["CohereModel"] = "CohereModel"
 
     timeout: float = 600.0
-
     def __init__(self, **data):
         """
         Initialize the CohereModel with the provided configuration.
@@ -192,11 +191,14 @@ def predict(self, conversation, temperature=0.7, max_tokens=256):
 
         usage_data = data.get("usage", {})
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -249,12 +251,15 @@ async def apredict(self, conversation, temperature=0.7, max_tokens=256):
 
             usage_data = data.get("usage", {})
 
+        if self.include_usage:
             usage = self._prepare_usage_data(
                 usage_data, prompt_timer.duration, completion_timer.duration
             )
-
             conversation.add_message(AgentMessage(content=message_content, usage=usage))
-            return conversation
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
+        return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
     def stream(self, conversation, temperature=0.7, max_tokens=256) -> Iterator[str]:
@@ -316,12 +321,15 @@ def stream(self, conversation, temperature=0.7, max_tokens=256) -> Iterator[str]
                     elif "usage" in chunk:
                         usage_data = chunk["usage"]
 
-        full_content = "".join(collected_content)
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
+        message_content = "".join(collected_content)
 
-        conversation.add_message(AgentMessage(content=full_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     @retry_on_status_codes((429, 529), max_retries=1)
     async def astream(
@@ -395,12 +403,14 @@ async def astream(
                         except json.JSONDecodeError:
                             continue
 
-            full_content = "".join(collected_content)
+            message_content = "".join(collected_content)
+        if self.include_usage:
             usage = self._prepare_usage_data(
                 usage_data, prompt_timer.duration, completion_timer.duration
             )
-
-            conversation.add_message(AgentMessage(content=full_content, usage=usage))
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(self, conversations: List, temperature=0.7, max_tokens=256) -> List:
         """
 
@@ -95,7 +95,6 @@ class DeepInfraModel(LLMBase):
     type: Literal["DeepInfraModel"] = "DeepInfraModel"
 
     timeout: float = 600.0
-
     def __init__(self, **data):
         """
         Initializes the DeepInfraModel instance with the provided API key
 
@@ -33,6 +33,7 @@ class DeepSeekModel(LLMBase):
 
     _BASE_URL: str = PrivateAttr("https://api.deepseek.com/v1")
 
+
     api_key: SecretStr
     allowed_models: List[str] = ["deepseek-chat", "deepseek-reasoner"]
     name: str = "deepseek-chat"