feat(agent-tracing): collect assistant messages into root run outputs (#421)

jerryliang64 · claude · web-flow · commit 8dcebafa1906 · 2026-03-29T13:17:22.000+08:00
## Summary - Automatically collect assistant text responses during message processing into `outputs.messages` - Aligns with LangGraph convention where root run `outputs` contains business data (messages) ## Changes - `core/agent-tracing/src/ClaudeAgentTracer.ts` - Add `outputMessages` array to `Trace` class to accumulate assistant text - Collect text from assistant messages in `handleAssistant` - Include `messages` in root run `outputs` in `handleResult` - `core/agent-tracing/test/ClaudeAgentTracer.test.ts` - New test: multi-turn assistant text collected into `outputs.messages` - New test: empty messages array when no assistant text ## Root Run outputs (before → after) ```diff outputs: { + messages: [{ role: 'assistant', content: '...' }, ...], result: '...', is_error: false, num_turns: 1, llmOutput: { promptTokens, completionTokens, ... }, } ``` ## Test plan - [x] All 58 tests pass (56 existing + 2 new) - [x] Verified locally in chair-sandbox-ai-use project 🤖 Generated with [Claude Code](https://claude.com/claude-code)  ## Summary by CodeRabbit * **New Features** * Assistant text content is now collected per trace and exposed in trace outputs as a messages array. * Mixed content blocks (text and tool-use) are preserved in the recorded messages. * **Tests** * Added tests verifying message collection for multi-part assistant outputs and the empty messages case when no assistant text appears.  Co-authored-by: Claude Opus 4.6 <noreply@anthropic.com>
diff --git a/core/agent-tracing/src/ClaudeAgentTracer.ts b/core/agent-tracing/src/ClaudeAgentTracer.ts
@@ -31,6 +31,7 @@ class Trace {
   private startTime: number;
   private executionOrder = 2; // Start at 2, root is 1
   private pendingToolUses = new Map<string, Run>();
+  private outputMessages: Array<{ role: string; content: ClaudeContentBlock[] }> = [];
   private tracer: ClaudeAgentTracer;
 
   constructor(tracer: ClaudeAgentTracer, options?: CreateTraceOptions) {
@@ -87,6 +88,11 @@ class Trace {
     const hasToolUse = content.some(c => c.type === 'tool_use');
     const hasText = content.some(c => c.type === 'text');
 
+    // Collect assistant message for outputs.messages
+    if (content.length > 0) {
+      this.outputMessages.push({ role: 'assistant', content });
+    }
+
     if (hasToolUse) {
       const eventTime = Date.now();
       // Create LLM run that initiated tool calls
@@ -164,6 +170,7 @@ class Trace {
     // Update and log root run end
     this.rootRun.end_time = this.startTime + (message.duration_ms || 0);
     this.rootRun.outputs = {
+      messages: this.outputMessages,
       result: message.result,
       is_error: message.is_error,
       num_turns: message.num_turns,
diff --git a/core/agent-tracing/test/ClaudeAgentTracer.test.ts b/core/agent-tracing/test/ClaudeAgentTracer.test.ts
@@ -328,6 +328,55 @@ describe('test/ClaudeAgentTracer.test.ts', () => {
     });
   });
 
+  describe('Trace outputs.messages in root run', () => {
+    it('should collect assistant text messages into outputs.messages', async () => {
+      const { claudeTracer, capturedRuns } = createTestEnv();
+      const trace = claudeTracer.createTrace();
+
+      const messages: SDKMessage[] = [
+        createMockInit(),
+        createMockAssistantWithTool(),
+        createMockUserToolResult(),
+        createMockAssistantTextOnly(),
+        createMockResult(),
+      ];
+
+      for (const msg of messages) {
+        await trace.processMessage(msg);
+      }
+
+      const rootEnd = capturedRuns.find(e => !e.run.parent_run_id && e.status === RunStatus.END);
+      assert(rootEnd, 'Should have root_run end');
+      const outputMessages = (rootEnd.run.outputs as any)?.messages;
+      assert(Array.isArray(outputMessages), 'outputs.messages should be an array');
+      assert.strictEqual(outputMessages.length, 2);
+      // First message has text + tool_use
+      assert.strictEqual(outputMessages[0].role, 'assistant');
+      assert.strictEqual(outputMessages[0].content.length, 2);
+      assert.strictEqual(outputMessages[0].content[0].type, 'text');
+      assert.strictEqual(outputMessages[0].content[0].text, 'Let me run that command for you.');
+      assert.strictEqual(outputMessages[0].content[1].type, 'tool_use');
+      assert.strictEqual(outputMessages[0].content[1].name, 'Bash');
+      // Second message has text only
+      assert.strictEqual(outputMessages[1].role, 'assistant');
+      assert.deepStrictEqual(outputMessages[1].content, [{ type: 'text', text: 'The answer is 21.' }]);
+    });
+
+    it('should have empty messages array when no assistant text', async () => {
+      const { claudeTracer, capturedRuns } = createTestEnv();
+      const trace = claudeTracer.createTrace();
+
+      await trace.processMessage(createMockInit());
+      await trace.processMessage(createMockResult());
+
+      const rootEnd = capturedRuns.find(e => !e.run.parent_run_id && e.status === RunStatus.END);
+      assert(rootEnd, 'Should have root_run end');
+      const outputMessages = (rootEnd.run.outputs as any)?.messages;
+      assert(Array.isArray(outputMessages), 'outputs.messages should be an array');
+      assert.strictEqual(outputMessages.length, 0);
+    });
+  });
+
   describe('Batch mode + text-only', () => {
     it('should trace a text-only response via processMessages', async () => {
       const { claudeTracer, capturedRuns } = createTestEnv();