feat(korean-persona): Nemotron-Personas-Korea 기반 한국어 퍼소나 주입 (3 skills, Codex 호환)#9
Open
hongsw wants to merge 1 commit into
Open
feat(korean-persona): Nemotron-Personas-Korea 기반 한국어 퍼소나 주입 (3 skills, Codex 호환)#9hongsw wants to merge 1 commit into
hongsw wants to merge 1 commit into
Conversation
Author
|
@revfactory 안녕하세요 시간이 괜찮으시면 리뷰 부탁드립니다 ^^
문서는 빼고 feat만 정리 해서 올리겠습니다. ps. 저는 활용했더니 성과가 좋아서 공유도 했습니다. https://news.hada.io/topic?id=28956 |
…, Codex 호환)
NVIDIA Nemotron-Personas-Korea(100만 행, CC BY 4.0) 합성 페르소나를 런타임
동적 매핑하여 한국 업무 매너·존댓말 레벨·산업 어휘가 살아있는 에이전트
정의를 생성한다. 기존 `skills/harness/`는 비침습 (description 기반 트리거
분기, 변경 없음).
신규 스킬 (3):
- skills/korean-persona-search/ — Parquet predicate pushdown 다축 필터
+ 다양성 샘플링. download.py(HF 캐시), search.py(검색).
의존성: huggingface_hub, pyarrow (lazy import + 누락 시 안내).
- skills/korean-voice-adapter/ — 합쇼체/해요체 매트릭스, 한국 직장 문화
(보고/회의/세대/지역), 13개 산업 어휘 사전.
- skills/korean-persona-harness/ — 메타 오케스트레이터 (서브 에이전트 5인
파이프라인: 시나리오 분석가 → 퍼소나 큐레이터 → 화법 어댑터 →
에이전트 빌더 → 다양성 QA). Phase 6에서 Claude Code/Codex 런타임 자동
감지로 출력 경로 분기.
설치 스크립트:
- scripts/install-korean-persona.sh — `--target {codex|claude-code|both}`
로컬 복사 또는 Codex `skill-installer`로 GitHub 직접 설치
(`--from-github OWNER/REPO`). dry-run 지원.
산출물:
- `.claude/agents/{name}.md` (Claude Code) 또는 `$CODEX_HOME/agents/{name}.md`
(Codex) — 한국어 voice + 출처 attribution(uuid + CC BY 4.0).
검증:
- search.py 합성 5행 데이터셋으로 8개 케이스(필터/다양성/persona-types/빈
결과) 모두 통과.
- 기존 `harness/` 디렉토리 무변경.
- 두 스킬 description은 트리거 분기되도록 구분 (한국어/한국 문화 명시).
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
a47b116 to
4aa51c5
Compare
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
Closes #8
Summary
skills/harness/비침습 (description 기반 트리거 분기, 변경 없음).claude/agents/{name}.md(또는$CODEX_HOME/agents/) + 출처 attribution(CC BY 4.0) 자동 삽입변경 내용 (코드만)
신규 스킬 (
skills/, 비침습):korean-persona-search/— Parquet predicate pushdown 다축 필터 + 다양성 샘플링.scripts/download.py(HF 캐시),scripts/search.py(검색).references/{schema,filter-cookbook}.md.korean-voice-adapter/— 합쇼/해요 매트릭스, 한국 직장 문화, 13개 산업 어휘 사전.references/{honorifics,workplace-culture,industry-tone}.md.korean-persona-harness/— 메타 오케스트레이터(서브 에이전트 5인 파이프라인: 시나리오 분석가 → 퍼소나 큐레이터 → 화법 어댑터 → 에이전트 빌더 → 다양성 QA).references/agents/5개 sub-agent 프롬프트. Phase 6에서 Claude Code/Codex 런타임 자동 감지로 출력 경로 분기.설치 스크립트:
scripts/install-korean-persona.sh—--target {codex|claude-code|both},--from-github,--dry-run. Codexskill-installer통합.--help로 옵션 확인.의존성:
huggingface_hub,pyarrow— lazy import, 누락 시 명확한 설치 안내.라이선스: 데이터셋 CC BY 4.0 → 생성 에이전트 정의 하단에 uuid + attribution 자동 삽입.
범위 외 (이 PR에서 제외)
본 PR은 코드만 다룹니다. README /
docs//CHANGELOG.md/ 비교 테스트 산출물(_workspace/comparison_test/)은 별도 PR(또는 머지 후 본가 문서 흐름)에서 다루는 편이 적절하다고 판단해 분리했습니다. 검증·정성 비교 결과는 코멘트로 첨부 가능합니다.Test plan
search.py합성 5행 데이터셋으로 8개 케이스(필터/다양성/persona-types/빈 결과/의존성 누락 안내) 통과bash -n scripts/install-korean-persona.sh통과,--help정상python -m py_compile skills/korean-persona-search/scripts/{download,search}.py통과skills/harness/무변경 (git diff upstream/main..HEAD -- skills/harness비어있음)영향
🤖 Generated with Claude Code