Helicone · chitalian · Oct 8, 2025 · Oct 8, 2025 · Oct 8, 2025 · Nov 20, 2025
diff --git a/valhalla/jawn/package.json b/valhalla/jawn/package.json
@@ -12,7 +12,6 @@
   "main": "index.js",
   "license": "MIT",
   "dependencies": {
-    "@anthropic-ai/tokenizer": "^0.0.4",
     "@aws-sdk/client-s3": "^3.678.0",
     "@aws-sdk/client-sqs": "^3.799.0",
     "@aws-sdk/s3-request-presigner": "^3.537.0",
@@ -52,7 +51,6 @@
     "generate-api-key": "^1.0.2",
     "gpt-tokenizer": "^2.1.2",
     "ioredis": "^5.3.2",
-    "js-tiktoken": "^1.0.8",
     "kafkajs": "^2.2.4",
     "lastmile": "^0.4.0",
     "llama-api-client": "^0.1.2",
@@ -71,7 +69,6 @@
     "sorted-btree": "^1.8.1",
     "stripe": "17.7.0",
     "swagger-ui-express": "^5.0.0",
-    "tiktoken": "^1.0.15",
     "typescript": "^5.2.2",
     "uuid": "^9.0.1",
     "uuidv4": "^6.2.13",

diff --git a/valhalla/jawn/src/lib/routers/tokenRouter.ts b/valhalla/jawn/src/lib/routers/tokenRouter.ts
diff --git a/valhalla/jawn/src/lib/shared/bodyProcessors/anthropicBodyProcessor.ts b/valhalla/jawn/src/lib/shared/bodyProcessors/anthropicBodyProcessor.ts
@@ -1,67 +1,41 @@
-import {
-  calculateModel,
-  getModelFromResponse,
-} from "../../../utils/modelMapper";
-import { getTokenCountAnthropic } from "../../tokens/tokenCounter";
 import { PromiseGenericResult, ok } from "../../../packages/common/result";
 import { IBodyProcessor, ParseInput, ParseOutput } from "./IBodyProcessor";
 
 export class AnthropicBodyProcessor implements IBodyProcessor {
   public async parse(
     parseInput: ParseInput
   ): PromiseGenericResult<ParseOutput> {
-    const { responseBody, requestModel, modelOverride } = parseInput;
+    const { responseBody } = parseInput;
     const parsedResponseBody = JSON.parse(responseBody);
-    const responseModel = getModelFromResponse(parsedResponseBody);
-    const model = calculateModel(requestModel, responseModel, modelOverride);
+
     if (
-      model?.includes("claude-3") ||
-      model?.includes("claude-sonnet-4") ||
-      model?.includes("claude-opus-4") ||
-      // for AI SDK
-      model?.includes("claude-4")
+      !parsedResponseBody?.usage?.output_tokens ||
+      !parsedResponseBody?.usage?.input_tokens
     ) {
-      if (
-        !parsedResponseBody?.usage?.output_tokens ||
-        !parsedResponseBody?.usage?.input_tokens
-      ) {
-        return ok({
-          processedBody: parsedResponseBody,
-        });
-      } else {
-        return ok({
-          processedBody: parsedResponseBody,
-          usage: {
-            totalTokens:
-              parsedResponseBody?.usage?.input_tokens +
-              parsedResponseBody?.usage?.output_tokens +
-              parsedResponseBody?.usage?.cache_creation_input_tokens +
-              parsedResponseBody?.usage?.cache_read_input_tokens,
-            promptTokens: parsedResponseBody?.usage?.input_tokens,
-            promptCacheWriteTokens:
-              parsedResponseBody?.usage?.cache_creation_input_tokens,
-            promptCacheReadTokens:
-              parsedResponseBody?.usage?.cache_read_input_tokens,
-            completionTokens: parsedResponseBody?.usage?.output_tokens,
-            promptCacheWrite5m:
-              parsedResponseBody?.usage?.cache_creation?.ephemeral_5m_input_tokens,
-            promptCacheWrite1h:
-              parsedResponseBody?.usage?.cache_creation?.ephemeral_1h_input_tokens,
-            heliconeCalculated: true,
-          },
-        });
-      }
+      return ok({
+        processedBody: parsedResponseBody,
+      });
     } else {
-      const prompt = parsedResponseBody?.prompt ?? "";
-      const completion = parsedResponseBody?.completion ?? "";
-      const completionTokens = await getTokenCountAnthropic(completion);
-      const promptTokens = await getTokenCountAnthropic(prompt);
       return ok({
         processedBody: parsedResponseBody,
         usage: {
-          totalTokens: promptTokens + completionTokens,
-          promptTokens: promptTokens,
-          completionTokens: completionTokens,
+          totalTokens:
+            parsedResponseBody?.usage?.input_tokens +
+            parsedResponseBody?.usage?.output_tokens +
+            parsedResponseBody?.usage?.cache_creation_input_tokens +
+            parsedResponseBody?.usage?.cache_read_input_tokens,
+          promptTokens: parsedResponseBody?.usage?.input_tokens,
+          promptCacheWriteTokens:
+            parsedResponseBody?.usage?.cache_creation_input_tokens,
+          promptCacheReadTokens:
+            parsedResponseBody?.usage?.cache_read_input_tokens,
+          completionTokens: parsedResponseBody?.usage?.output_tokens,
+          promptCacheWrite5m:
+            parsedResponseBody?.usage?.cache_creation
+              ?.ephemeral_5m_input_tokens,
+          promptCacheWrite1h:
+            parsedResponseBody?.usage?.cache_creation
+              ?.ephemeral_1h_input_tokens,
           heliconeCalculated: true,
         },
       });

diff --git a/valhalla/jawn/src/lib/shared/bodyProcessors/anthropicStreamBodyProcessor.ts b/valhalla/jawn/src/lib/shared/bodyProcessors/anthropicStreamBodyProcessor.ts
@@ -1,6 +1,3 @@
-import { calculateModel } from "../../../utils/modelMapper";
-import { consolidateTextFields } from "../../../utils/streamParser";
-import { getTokenCountAnthropic } from "../../tokens/tokenCounter";
 import { PromiseGenericResult, ok } from "../../../packages/common/result";
 import { IBodyProcessor, ParseInput, ParseOutput } from "./IBodyProcessor";
 import { isParseInputJson } from "./helpers";
@@ -25,9 +22,7 @@ export class AnthropicStreamBodyProcessor implements IBodyProcessor {
       });
     }
 
-    const { responseBody, requestBody, requestModel, modelOverride } =
-      parseInput;
-    const model = calculateModel(requestModel, undefined, modelOverride);
+    const { responseBody } = parseInput;
 
     // Store the original response body for later use
     const originalResponseBody = responseBody;
@@ -110,69 +105,38 @@ export class AnthropicStreamBodyProcessor implements IBodyProcessor {
     }
 
     try {
+      const processedBody = {
+        ...processConsolidatedJsonForClaude3(processedLines),
+        // Store the original response body
+        streamed_data: originalResponseBody,
+      };
+
       if (
-        model?.includes("claude-3") ||
-        model?.includes("claude-sonnet-4") ||
-        model?.includes("claude-opus-4") ||
-        // for AI SDK
-        model?.includes("claude-4")
+        !processedBody?.usage?.output_tokens ||
+        !processedBody?.usage?.input_tokens
       ) {
-        const processedBody = {
-          ...processConsolidatedJsonForClaude3(processedLines),
-          // Store the original response body
-          streamed_data: originalResponseBody,
-        };
-
-        if (
-          !processedBody?.usage?.output_tokens ||
-          !processedBody?.usage?.input_tokens
-        ) {
-          return ok({
-            processedBody: processedBody,
-          });
-        } else {
-          return ok({
-            processedBody: processedBody,
-            usage: {
-              totalTokens:
-                processedBody?.usage?.input_tokens +
-                processedBody?.usage?.output_tokens +
-                processedBody?.usage?.cache_creation_input_tokens +
-                processedBody?.usage?.cache_read_input_tokens,
-              promptTokens: processedBody?.usage?.input_tokens,
-              promptCacheWriteTokens:
-                processedBody?.usage?.cache_creation_input_tokens,
-              promptCacheReadTokens:
-                processedBody?.usage?.cache_read_input_tokens,
-              completionTokens: processedBody?.usage?.output_tokens,
-              promptCacheWrite5m:
-                processedBody?.usage?.cache_creation?.ephemeral_5m_input_tokens,
-              promptCacheWrite1h:
-                processedBody?.usage?.cache_creation?.ephemeral_1h_input_tokens,
-              heliconeCalculated: true,
-            },
-          });
-        }
+        return ok({
+          processedBody: processedBody,
+        });
       } else {
-        const claudeData = {
-          ...processedLines[processedLines.length - 1],
-          completion: processedLines.map((d) => d.completion).join(""),
-        };
-        const completionTokens = await getTokenCountAnthropic(
-          claudeData.completion
-        );
-        const promptTokens = await getTokenCountAnthropic(
-          JSON.parse(requestBody ?? "{}")?.prompt ?? ""
-        );
         return ok({
-          processedBody: {
-            ...consolidateTextFields(processedLines),
-            streamed_data: originalResponseBody,
-          },
+          processedBody: processedBody,
           usage: {
-            totalTokens: completionTokens + promptTokens,
-            promptTokens: promptTokens,
-            completionTokens: completionTokens,
+            totalTokens:
+              processedBody?.usage?.input_tokens +
+              processedBody?.usage?.output_tokens +
+              processedBody?.usage?.cache_creation_input_tokens +
+              processedBody?.usage?.cache_read_input_tokens,
+            promptTokens: processedBody?.usage?.input_tokens,
+            promptCacheWriteTokens:
+              processedBody?.usage?.cache_creation_input_tokens,
+            promptCacheReadTokens:
+              processedBody?.usage?.cache_read_input_tokens,
+            completionTokens: processedBody?.usage?.output_tokens,
+            promptCacheWrite5m:
+              processedBody?.usage?.cache_creation?.ephemeral_5m_input_tokens,
+            promptCacheWrite1h:
+              processedBody?.usage?.cache_creation?.ephemeral_1h_input_tokens,
             heliconeCalculated: true,
           },
         });

diff --git a/valhalla/jawn/src/lib/shared/bodyProcessors/llamaStreamBodyProcessor.ts b/valhalla/jawn/src/lib/shared/bodyProcessors/llamaStreamBodyProcessor.ts
@@ -1,5 +1,3 @@
-import { calculateModel } from "../../../utils/modelMapper";
-import { getTokenCountAnthropic } from "../../tokens/tokenCounter";
 import { PromiseGenericResult, ok } from "../../../packages/common/result";
 import { IBodyProcessor, ParseInput, ParseOutput } from "./IBodyProcessor";
 import { isParseInputJson } from "./helpers";
@@ -14,9 +12,7 @@ export class LlamaStreamBodyProcessor implements IBodyProcessor {
       });
     }
 
-    const { responseBody, requestBody, requestModel, modelOverride } =
-      parseInput;
-    const model = calculateModel(requestModel, undefined, modelOverride);
+    const { responseBody } = parseInput;
 
     const originalResponseBody = responseBody;
     const eventLines = responseBody.split("\n");
@@ -157,20 +153,6 @@ export class LlamaStreamBodyProcessor implements IBodyProcessor {
         }
       }
 
-      if (!usage) {
-        const completionTokens = await getTokenCountAnthropic(completionText);
-        const promptTokens = await getTokenCountAnthropic(
-          JSON.parse(requestBody ?? "{}")?.messages?.map((m: any) => m.content).join("") ?? ""
-        );
-
-        usage = {
-          totalTokens: completionTokens + promptTokens,
-          promptTokens: promptTokens,
-          completionTokens: completionTokens,
-          heliconeCalculated: true,
-        };
-      }
-
       return ok({
         processedBody: processedBody,
         usage: usage,

diff --git a/valhalla/jawn/src/lib/shared/bodyProcessors/openAIStreamProcessor.ts b/valhalla/jawn/src/lib/shared/bodyProcessors/openAIStreamProcessor.ts
@@ -1,5 +1,4 @@
 import { consolidateTextFields } from "../../../utils/streamParser";
-import { getTokenCountGPT3 } from "../../tokens/tokenCounter";
 import { PromiseGenericResult, err, ok } from "../../../packages/common/result";
 import { IBodyProcessor, ParseInput, ParseOutput } from "./IBodyProcessor";
 import { isParseInputJson } from "./helpers";

diff --git a/valhalla/jawn/src/lib/shared/bodyProcessors/vercelStreamProcessor.ts b/valhalla/jawn/src/lib/shared/bodyProcessors/vercelStreamProcessor.ts
@@ -1,6 +1,5 @@
 import { PromiseGenericResult, ok } from "../../../packages/common/result";
 import { IBodyProcessor, ParseInput, ParseOutput } from "./IBodyProcessor";
-import { getTokenCountGPT3 } from "../../tokens/tokenCounter";
 import { calculateModel } from "../../../utils/modelMapper";
 
 export class VercelStreamProcessor implements IBodyProcessor {
@@ -105,66 +104,6 @@ export class VercelStreamProcessor implements IBodyProcessor {
       requestModel ||
       "unknown";
 
-    // If usage is all zeros or undefined, calculate tokens as fallback
-    if (
-      !usage ||
-      usage.totalTokens === 0 ||
-      (usage.promptTokens === 0 && usage.completionTokens === 0)
-    ) {
-      try {
-        // Calculate completion tokens
-        const completionTokens = completionText
-          ? await getTokenCountGPT3(completionText, model)
-          : 0;
-        let promptTokens = 0;
-
-        // Try to parse the request body to get prompt tokens
-        if (requestBody) {
-          try {
-            const parsedRequest = JSON.parse(requestBody);
-            // Vercel uses 'messages'
-            if (
-              parsedRequest.messages &&
-              Array.isArray(parsedRequest.messages)
-            ) {
-              const promptText = parsedRequest.messages
-                .map((msg: any) => {
-                  if (msg.content) {
-                    // Handle string content
-                    if (typeof msg.content === "string") {
-                      return msg.content;
-                    }
-                    // Handle content array (structured content)
-                    if (Array.isArray(msg.content)) {
-                      return msg.content
-                        .filter((c: any) => c.type === "text")
-                        .map((c: any) => c.text || "")
-                        .join("");
-                    }
-                  }
-                  return "";
-                })
-                .join(" ");
-              promptTokens = promptText
-                ? await getTokenCountGPT3(promptText, model)
-                : 0;
-            }
-          } catch (e) {
-            console.error("Error parsing request for token calculation", e);
-          }
-        }
-
-        usage = {
-          promptTokens,
-          completionTokens,
-          totalTokens: promptTokens + completionTokens,
-          heliconeCalculated: true,
-        };
-      } catch (e) {
-        console.error("Error calculating tokens for Vercel", e);
-      }
-    }
-
     try {
       // Create OpenAI-compatible response format
       const processedBody: any = {

diff --git a/valhalla/jawn/src/lib/tokens/gptWorker.js b/valhalla/jawn/src/lib/tokens/gptWorker.js
diff --git a/valhalla/jawn/src/lib/tokens/gptWorker.ts b/valhalla/jawn/src/lib/tokens/gptWorker.ts