Skip to content

Nova 진화 제안 — 탐색 품질 강화 (2026-04-24 meshcore_db 사후 분석) #5

@givepro91

Description

@givepro91

배경

2026-04-24 외부 프로젝트(meshcore_db) 세션 사후 분석에서 Nova 룰 우회 문제가 보고됨.
한 세션에서 --emergency 4회, Plan 미수립, Evaluator 1회만 실행.
결과적으로 사전 예방되지 못한 실수 4건:

  1. docs/schema/auto/*.md가 Staging 기준임을 독자가 모르고 PROD 복제 설계에 사용 → 재작업
  2. pg_dump 결과 sed 's/public\./gis./g' 전역 치환이 PostGIS 타입 참조까지 변경 → 3 테이블 DDL 실패
  3. VPC peering 유무·NAT 확인 없이 FDW 설계 → Phase 전면 블록
  4. restart_mkdocs.sh 실행만으로 DataLab 반영된다고 가정(실제로는 React SPA 별도 배포) → 사용자 사이트 404

외부 진단 (원본)

Agent 회피의 구조적 원인으로 6가지 제시:

원인 현상 Agent가 회피하는 이유
탐색적 대화 모드 부재 Plan은 "결정 확정" 전제, 실제 세션은 결정 변화 빈번 Plan 유지 비용 → 절차 건너뛰는 게 rational
Hard Gate 획일성 문서 전용 변경에도 Evaluator PASS 강제 정상 우회 경로 없음 → --emergency 남용
파일 수 기준 경직성 3파일+ = 무조건 Plan (md/py 동일 취급) 리스크 낮은 변경에도 Plan 부담
--emergency 이분법 정상/긴급 둘뿐 "편의 우회"로 변질, 남용 감지 불가
사전 실측 강제 없음 "RDS 생성" 등 키워드 감지 시 자동 체크리스트 없음 docs만 믿고 설계 진행
배포 경로 신뢰 부재 구버전 스크립트와 새 배포 경로 공존 파일명으로 임의 판단

제안된 개선 (원본 P0~P2)

  • P0.1 /nova:explore 탐색 모드 신설
  • P0.2 커밋 파일 셋 분류 기반 차등 Hard Gate (docs-only / full / infra)
  • P0.3 --emergency 4분화 + 사용 이력 추적
  • P1.4 복잡도 점수 자동 계산 (비가역 +3, DB +1, 외부 연결 +2, UI +1)
  • P1.5 키워드 기반 사전 실측 체크리스트 (새 RDS/FDW/peering/DNS/스키마 복제)
  • P1.6 배포 경로 단일 진입점 강제 + 구식 스크립트 경고
  • P2.7 Incidents DB (docs/nova-incidents/{YYYY-MM-DD}-{slug}.md)
  • P2.8 대화 중 미니 Plan 자동 제안

내부 토론에서 나온 관점 (가정/추론 단계)

1. /nova:explore 신설은 과한 것일 수 있음

  • 기본 Claude Code 대화 자체가 이미 탐색
  • 별도 커맨드 신설 시 "탐색인지 아닌지" 선언 부담 추가
  • 진짜 문제는 탐색 → 구현 전환 타이밍이 아닌가 (P2.8 "미니 Plan 자동 제안"과 같은 메커니즘)

2. "탐색 품질" 자체가 근본 문제일 가능성

사용자 의견: "이번 문제(DB 타입 불일치 등)는 탐색을 제대로 못한 것 아닌가"

  • 실수 4건 공통 패턴: "확인 가능한 것을 확인하지 않고 진행"
  • 전부 1~3개 tool call이면 검증 가능했던 사안
  • 토큰/모델 한계보단 탐색 방법론 부재로 보임

3. 가정 레지스터 아이디어 (미검증)

탐색 중 Agent가 사용하는 가정을 명시적으로 추적, 비가역 작업 전 미검증 가정 차단하는 방식 — 내부 토론 중 떠올랐으나 검증 전.

레퍼런스 조사 (현역 오픈소스/표준, 2025~2026)

같은 문제를 다루는 기존 패턴:

레퍼런스 핵심 패턴 관련성
Cline Plan/Act Mode Plan mode는 read-only 탐색, Act mode로 명시적 토글 후 실행 ★★★ 탐색/실행 격리
systematic-debugging skill Investigation → Analysis → Hypothesis → Implementation 4단계. "NO FIXES WITHOUT ROOT CAUSE FIRST". 성공률 40%→95% ★★★ 가정/검증 방법론
Ultra Plan — 3 Explorers + 1 Critic 병렬 탐색 agent 3 + 비평 1 (Anthropic 공식) ★★★ deepplan과 유사
Claude Code Explore subagent built-in, thoroughness 3단계 조절 ★★ 이미 활용 가능
Agent Skills 표준 (2025.12) progressive disclosure, hot-reloading Nova 스킬 기반 표준
Addy Osmani LLM workflow 2026 Specs, skills, MCPs, small chunks, always review, AI-on-AI reviews 업계 합의 방향

업계 합의

  • 이번 실수는 모델 한계 아님. 실측 명령 몇 줄이면 해결됐을 사안.
  • Cline, Anthropic, Addy Osmani 모두 "AI는 pair programmer, autonomous judgment 아님" 명시.
  • 탐색을 격리·강제하는 구조가 해법이라는 합의.

현재 상태

모든 제안이 아직 가정/추론 단계. 구현 전 추가 검증 필요:

  • 원본 제안서의 측정 기준(주당 --emergency 5→1회 등)이 Nova 텔레메트리로 검증 가능한가
  • Cline Plan/Act 패턴이 Claude Code 환경에서 /nova:plan 활성 시 read-only 강제로 실제 구현 가능한가
  • systematic-debugging skill 흡수/fork 시 Nova 스킬 철학과 정합성
  • P1.4 복잡도 점수 가중치를 실제 세션 데이터 없이 정할 때 gaming 리스크
  • P2.7 Incidents DB의 유사 상황 매칭 기준 (소음 누적 방지)

다음 단계 후보 (결정 안 됨)

  1. 최소 실험: P0.2 차등 게이트만 먼저 1~2주 운영, 효과 측정 후 확장
  2. 전체 P0 묶음: explore + 차등 게이트 + emergency 4분화 한 릴리스
  3. 레퍼런스 흡수 우선: Cline Plan/Act, systematic-debugging 패턴을 Nova 스킬로 먼저 채택
  4. /nova:evolve 사이클: 본 이슈를 근거로 Plan → Design → 구현 사이클에 태움

참고

  • 외부 진단 출처: meshcore_db 프로젝트 (2026-04-24 세션)
  • 토론 맥락: Opus 4.7 세션 (2026-04-24)

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions