swarmauri
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AI21StudioModel.py
Lines changed: 32 additions & 19 deletions b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AI21StudioModel.py
Lines changed: 32 additions & 19 deletions
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AnthropicModel.py
Lines changed: 33 additions & 26 deletions b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/AnthropicModel.py
Lines changed: 33 additions & 26 deletions
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/CohereModel.py
Lines changed: 28 additions & 24 deletions b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/CohereModel.py
Lines changed: 28 additions & 24 deletions
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepInfraModel.py
Lines changed: 0 additions & 9 deletions b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepInfraModel.py
Lines changed: 0 additions & 9 deletions
diff --git a/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepSeekModel.py
Lines changed: 0 additions & 5 deletions b/‎pkgs/swarmauri_standard/swarmauri_standard/llms/DeepSeekModel.py
Lines changed: 0 additions & 5 deletions
@@ -1,12 +1,12 @@
 import asyncio
 import json
-from typing import AsyncIterator, Iterator, List, Literal, Type
+from typing import AsyncIterator, Iterator, List, Type
 
 import httpx
-from pydantic import PrivateAttr, SecretStr
+from pydantic import PrivateAttr
+from swarmauri_base.ComponentBase import ComponentBase
 from swarmauri_base.llms.LLMBase import LLMBase
 from swarmauri_base.messages.MessageBase import MessageBase
-from swarmauri_base.ComponentBase import ComponentBase
 
 from swarmauri_standard.conversations.Conversation import Conversation
 from swarmauri_standard.messages.AgentMessage import AgentMessage, UsageData
@@ -32,16 +32,11 @@ class AI21StudioModel(LLMBase):
     Provider resources: https://docs.ai21.com/reference/jamba-15-api-ref
     """
 
-    api_key: SecretStr
-    allowed_models: List[str] = []
-    name: str = ""
-    type: Literal["AI21StudioModel"] = "AI21StudioModel"
     _client: httpx.Client = PrivateAttr(default=None)
     _async_client: httpx.AsyncClient = PrivateAttr(default=None)
     _BASE_URL: str = PrivateAttr(
         default="https://api.ai21.com/studio/v1/chat/completions"
     )
-    timeout: float = 600.0
 
     def __init__(self, **data) -> None:
         """
@@ -147,9 +142,12 @@ def predict(
         message_content = response_data["choices"][0]["message"]["content"]
         usage_data = response_data.get("usage", {})
 
-        usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
-
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -196,9 +194,12 @@ async def apredict(
         message_content = response_data["choices"][0]["message"]["content"]
         usage_data = response_data.get("usage", {})
 
-        usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
-
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(usage_data, prompt_timer.duration)
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -267,6 +268,15 @@ def stream(
 
         conversation.add_message(AgentMessage(content=message_content, usage=usage))
 
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
     @retry_on_status_codes((429, 529), max_retries=1)
     async def astream(
         self,
@@ -327,11 +337,14 @@ async def astream(
                 except json.JSONDecodeError:
                     pass
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        # Prepare usage data if tracking is enabled
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(
         self,
 
@@ -1,12 +1,12 @@
 import asyncio
 import json
-from typing import AsyncIterator, Dict, Iterator, List, Literal, Type
+from typing import AsyncIterator, Dict, Iterator, List, Type
 
 import httpx
-from pydantic import PrivateAttr, SecretStr
+from pydantic import PrivateAttr
+from swarmauri_base.ComponentBase import ComponentBase
 from swarmauri_base.llms.LLMBase import LLMBase
 from swarmauri_base.messages.MessageBase import MessageBase
-from swarmauri_base.ComponentBase import ComponentBase
 
 from swarmauri_standard.conversations.Conversation import Conversation
 from swarmauri_standard.messages.AgentMessage import AgentMessage, UsageData
@@ -33,13 +33,6 @@ class AnthropicModel(LLMBase):
     _client: httpx.Client = PrivateAttr()
     _async_client: httpx.AsyncClient = PrivateAttr()
 
-    api_key: SecretStr
-    allowed_models: List[str] = []
-    name: str = ""
-    type: Literal["AnthropicModel"] = "AnthropicModel"
-
-    timeout: float = 600.0
-
     def __init__(self, **data):
         super().__init__(**data)
         headers = {
@@ -162,11 +155,15 @@ def predict(
             message_content = response_data["content"][0]["text"]
 
         usage_data = response_data["usage"]
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -245,10 +242,13 @@ def stream(
                             except (json.JSONDecodeError, KeyError):
                                 continue
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     @retry_on_status_codes((429, 529), max_retries=1)
     async def apredict(
@@ -287,11 +287,15 @@ async def apredict(
             message_content = response_data["content"][0]["text"]
 
         usage_data = response_data["usage"]
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -372,10 +376,13 @@ async def astream(
                             except (json.JSONDecodeError, KeyError):
                                 continue
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(
         self, conversations: List[Conversation], temperature=0.7, max_tokens=256
 
@@ -1,12 +1,12 @@
 import asyncio
 import json
-from typing import AsyncIterator, Dict, Iterator, List, Literal
+from typing import AsyncIterator, Dict, Iterator, List
 
 import httpx
-from pydantic import PrivateAttr, SecretStr
+from pydantic import PrivateAttr
+from swarmauri_base.ComponentBase import ComponentBase
 from swarmauri_base.llms.LLMBase import LLMBase
 from swarmauri_base.messages.MessageBase import MessageBase
-from swarmauri_base.ComponentBase import ComponentBase
 
 from swarmauri_standard.messages.AgentMessage import AgentMessage, UsageData
 from swarmauri_standard.utils.duration_manager import DurationManager
@@ -32,13 +32,6 @@ class CohereModel(LLMBase):
     _BASE_URL: str = PrivateAttr("https://api.cohere.ai/v1")
     _client: httpx.Client = PrivateAttr()
 
-    api_key: SecretStr
-    allowed_models: List[str] = []
-    name: str = ""
-    type: Literal["CohereModel"] = "CohereModel"
-
-    timeout: float = 600.0
-
     def __init__(self, **data):
         """
         Initialize the CohereModel with the provided configuration.
@@ -185,11 +178,14 @@ def predict(self, conversation, temperature=0.7, max_tokens=256):
 
         usage_data = data.get("usage", {})
 
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
-        conversation.add_message(AgentMessage(content=message_content, usage=usage))
         return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
@@ -242,12 +238,15 @@ async def apredict(self, conversation, temperature=0.7, max_tokens=256):
 
             usage_data = data.get("usage", {})
 
+        if self.include_usage:
             usage = self._prepare_usage_data(
                 usage_data, prompt_timer.duration, completion_timer.duration
             )
-
             conversation.add_message(AgentMessage(content=message_content, usage=usage))
-            return conversation
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
+
+        return conversation
 
     @retry_on_status_codes((429, 529), max_retries=1)
     def stream(self, conversation, temperature=0.7, max_tokens=256) -> Iterator[str]:
@@ -309,12 +308,15 @@ def stream(self, conversation, temperature=0.7, max_tokens=256) -> Iterator[str]
                     elif "usage" in chunk:
                         usage_data = chunk["usage"]
 
-        full_content = "".join(collected_content)
-        usage = self._prepare_usage_data(
-            usage_data, prompt_timer.duration, completion_timer.duration
-        )
+        message_content = "".join(collected_content)
 
-        conversation.add_message(AgentMessage(content=full_content, usage=usage))
+        if self.include_usage:
+            usage = self._prepare_usage_data(
+                usage_data, prompt_timer.duration, completion_timer.duration
+            )
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     @retry_on_status_codes((429, 529), max_retries=1)
     async def astream(
@@ -388,12 +390,14 @@ async def astream(
                         except json.JSONDecodeError:
                             continue
 
-            full_content = "".join(collected_content)
+            message_content = "".join(collected_content)
+        if self.include_usage:
             usage = self._prepare_usage_data(
                 usage_data, prompt_timer.duration, completion_timer.duration
             )
-
-            conversation.add_message(AgentMessage(content=full_content, usage=usage))
+            conversation.add_message(AgentMessage(content=message_content, usage=usage))
+        else:
+            conversation.add_message(AgentMessage(content=message_content))
 
     def batch(self, conversations: List, temperature=0.7, max_tokens=256) -> List:
         """
 
@@ -40,15 +40,6 @@ class DeepInfraModel(LLMBase):
     _client: httpx.Client = PrivateAttr(default=None)
     _async_client: httpx.AsyncClient = PrivateAttr(default=None)
 
-    api_key: SecretStr
-    allowed_models: List[str] = []
-
-    name: str = ""
-
-    type: Literal["DeepInfraModel"] = "DeepInfraModel"
-
-    timeout: float = 600.0
-
     def __init__(self, **data):
         """
         Initializes the DeepInfraModel instance with the provided API key
 
@@ -33,11 +33,6 @@ class DeepSeekModel(LLMBase):
 
     _BASE_URL: str = PrivateAttr("https://api.deepseek.com/v1")
 
-    api_key: SecretStr
-    allowed_models: List[str] = []
-    name: str = ""
-
-    type: Literal["DeepSeekModel"] = "DeepSeekModel"
     _client: httpx.Client = PrivateAttr()
     _async_client: httpx.AsyncClient = PrivateAttr()