§dictcli: 힣의 낱말이 서로 닿는 자리

이 노트에 대하여

이 노트는 dictcli 담당자가 현재의 중심과 경계를 기록하는 자리다. 이 리포는 한영사전이 아니라 힣이 말하는 낱말들이 서로 닿게 하는 연결망이며, 어느 방향에서 찔러와도 그 개념의 성좌에 도달하는지를 지표로 삼는다. 태그 정규화와 3층 모델의 연대기는 ARCHIVE로 내려두고, 여기에는 오늘의 기준과 남은 확인만 둔다.

히스토리

[2026-07-27 Mon 18:06] @claude-code(thinkpad) — 담당자 문서 재정렬. 중심을 “한↔영 쿼리 확장”에서 “힣의 낱말 연결망”으로 옮기고, 지표를 andenken 검색 개선 → 찔러보기(probe) 도달률로 교체. 기준선 측정: 개념망 관계 114/3,989(2.9%), 어쏠로그 제목 어휘 497/737 없음, 공개키 어휘 33개 중 연결된 것 2개(보편·특수, 둘 다 Syntopicon 유래). 사전 오염 4건 확인 — 경계→warning·admonishment·beingalert, 연결→throw, 공존→tancy, 공개키→openapi. AGENTS.md·NEXT.md 재작성(영어 → 한글), drafts/seed-core.edn 성좌 초안 7개. 옛 중심을 담고 있던 제목과 파일명을 새 중심으로 교체(태그 정규화·개인 어휘 사전 → 힣의 낱말이 서로 닿는 자리). identifier가 그대로이므로 공개 URL과 denote: 링크는 깨지지 않는다. 구현은 씨앗 확정 후로 미룸.
[2026-07-27 Mon 17:20] @claude-code(thinkpad) — andenken 담당 세션과 사실 대조 3회 왕복. stem 실행 경로(repo에는 있고 스킬 번들에는 없음), 번들 help의 잘못된 경로 안내, expand 실무어 미수집을 상호 확인. 저쪽 결론은 COMPARISON.md §12.6. 양쪽이 서로의 오류를 하나씩 정정했고, andenken은 자기 로드맵에서 dictcli 의존을 명시적으로 끊었다.
[2026-03-30 Mon 16:34] @pi-entwurf — Kiwi 형태소 분석 1단계 완료. stem→expand 파이프라인 동작 확인. 298de4c
[2026-03-23 Mon 17:54] @pi-claude — 태그 정규화 Phase 1 실행(단복수 18쌍 94파일), meta-sync.py 재실행 후 1,270 트리플 import(303 :trans + 967 :source), graph.edn 1,742→3,012 트리플(~~73%), delta 0 완전 동기화 확인. hunspell-ko 어휘집 검토 → llmlog 작성(검증 레이어~~ 매핑 소스 전략). 커밋 0e2c9f3.
[2026-03-20 Fri 12:45] @pi-claude — 문서 전체 현황 검토. 1,224 트리플(+74 실무 용어). 구상 9개 중 ✅4/🔧3/❌1/🚫1. 핵심 발견: 실무 용어 0개 문제 해결(74 트리플), expand 실전 효과 입증(score +3~5%). 태그 정규화 Phase 1 미실행(agent 24 vs agents 24 여전), saiculture 한↔독 매핑 미착수, Emacs CAPE 미구현. 종합 현황 테이블 문서 끝에 추가. 4499016
[2026-03-16 Mon 16:50] @pi-claude — 3층 모델 초기버전 완성. dictcli expand 스킬 등록 완료 (pi-skills/dictcli). native binary 23MB, 0.009초. 1층(knowledge_search 84K chunks MRR 0.872) + 2층(denotecli+dblock) + 3층(dictcli expand 1,150 트리플). br 이슈 11/13 완료. 세션 커밋 10개. a805a8d
[2026-03-16 Mon 14:35] @pi-claude — dictcli EDN 트리플 그래프 전환 완료. 1,150 트리플, 835 :trans, 인바리언트 전체 통과. 단어=개념 정책 확립. ahyatt/triples+ekg 리서치 완료 — 구조적으로 동일. Emacs completion(CAPE/CAPF) 인터페이스 이슈 생성 → doomemacs-config 담당자에게 위임. 4404448
[2026-03-16 Mon 12:45] @junghan — 작업중인데 더 강화할거야. 몇개 이맥스 파트도 참여해서 봐야겠어.
[2026-03-15 Sun 11:30] @pi-claude — knowledge_search tool 등록 완료. pi 세션에서 “보편 학문” 쿼리 → 박승억 보편학 노트(universalism 태그) 즉시 반환. 1층 인터페이스 확립. f6e3494
[2026-03-15 Sun 11:20] @pi-claude — agent-config Phase 2 org RAG 벤치마크 완료. 1층(임베딩) 기준선: Hit 100%, MRR 0.860. “보편→universalism” 크로스링귀얼 검색 동작 확인. Jina rerank 역효과 발견 → MMR 교체. 3층 모델(임베딩 /dblock/dictcli)에서 dictcli의 역할이 명확해짐: “보편” MRR 0.13이 가장 낮아 wordmap 매핑이 필요. 8d80312
[2026-03-12 Thu 16:52] @pi-claude — dictcli 리포 생성 완료 (junghan0611/dictcli). Clojure + GraalVM native-image로 단일 바이너리(0.06초). ten 형식 파서, SQLite 인덱스, wordmap 48,872건 동작 확인. run.sh 커맨드 모음, AGENTS.md/README.md 세트 구성. aarch64는 타겟 머신 빌드 필요. 고민에서 구현체까지 도달 — 이후 로직 채우기는 해당 리포에서.
[2026-03-12 Thu 03:43] @junghan — 이기상 교수님 글을 따로 denote-silo로 관리한다. 그래야 우리가 틀을 배우기 편할거야.
[2026-03-11 Wed 15:50] @pi-claude — saiculture wordmap.json 검토. 48,872 고유 단어, cooccurrence 100쌍, 존재와시간 용어해설에서 한↔독 110핵심어 확인. dict/ glossary(한↔영) + saiculture(한↔독, 연상맵) + Denote(영어태그) 3축 통합 구조 정리. dictcli 데이터 소스로 확정.
[2026-03-11 Wed 08:50] @glg-gemini — 제미나이(glg) 리뷰 추가. 클로드의 구현 지향적 구조(1kb 집중)를 지지하며, 그 위에 ‘통제어’가 아닌 ‘중력장(마당)‘의 관점을 더함. 직관적인 번역어의 선택이 인공지능 시대 지식의 장벽을 허무는 Constitutional AI의 실천임을 논의 후 문서 하단에 헤딩 추가.
[2026-03-11 Wed 09:25] @pi-claude — 네이버 블로그 크롤러 구현 완료 (memex-kb). 이기상 교수 블로그(saiculture) 3,299편 + 39개 카테고리 + 이미지 전량 크롤링 도구. Denote 네이밍(YYYYMMDDTHHMMSS, 초=logNo%60), 카테고리→폴더(공백→하이픈), se-component 파싱으로 텍스트/이미지 순서 보존, 해시태그 워드맵 생성. 교수님의 한글 해시태그(#초월론적_주체, #인식의_그물망 등)가 곧 dictcli의 실전 데이터 — 80년 연구의 한글 사유를 영어 태그로 매핑하는 워드맵의 씨앗.
[2026-03-11 Wed 08:05] @pi-claude — lifetract 데이터 갱신 + steps 버그 수정 + SKILL.md 개선 작업 직후 리뷰. “오늘 한 작업이 이 문서의 패턴 그 자체” — 데이터→Go CLI→skill→에이전트 사이클을 lifetract에서 또 한 바퀴 돌고 나니 dictcli가 다음 한 칸임이 체감됨. SKILL.md에 “Why This Exists” 적으면서 태그 선택(piskills vs pi+skills)이 세렌디피티를 만들거나 끊는다는 걸 실감. 16,639 용어 + ten + 패턴 = 다리만 놓으면 된다. 여러 봇이 리뷰하고 숙성되면 한번에 만들어낼 것.
[2026-03-10 Tue 22:39] @junghan — 내 생각 프롬프트로 남겨 놓을게
[2026-03-10 Tue 21:55] @pi-claude — org-supertag 검토 완료. supertag vs 기존 패턴(data→Go CLI→skill) 비교 분석. ten/glossary 자산(16,639 용어)과의 관계 정리. dictcli 구상 추가.
[2026-03-09 Mon 22:43] @junghan — 리딩
[2026-03-09 Mon 19:40] 생성 — 태그 정규화 dry-run 결과 + 개인 어휘 사전 구상. 한글 사고 → 영어 태그 매핑 문제의 실체화.

[2026-07-27 Mon] 담당자의 현재 보고 — 사전이 아니라 연결망

dictcli는 한영사전이 아니다. 가든 태그를 채우는 도구도 아니다. 두 가지 읽기가 지금 데이터의 대부분을 만들었고 둘 다 틀렸다.

이 리포가 답해야 하는 질문은 하나다. 힣이 “공존”이라고 말할 때 그것은 무엇을 뜻하며 어떤 배경에서 나온 말인가. 처음 시작하는 에이전트는 그것을 알 방법이 없다. 공개키는 public key가 아니고, 1KB 공개키는 힣의 PKM-AI 어휘다. 그릇은 vessel이기 전에 담을 자리를 가리키는 말이다. 낱말이 사전에서 오면 사전의 뜻이 오고, 그 뜻은 힣의 뜻이 아니다.

지금 맡은 일

힣이 쓰는 뜻을 데이터로 둔다. 사전 뜻과 어긋나면 사전이 오류다 — 나란히 보관할 두 번째 의견이 아니다. 근거는 힣의 글에서 온다: :source 메타노트, 어쏠로그, 전역 AGENTS.md. 근거가 없으면 링크만 걸고 묻는다. 어휘집에서 뜻을 추론하지 않는다.
한↔한 축을 본체로 세운다. :opposite :related :broader :narrower 가 사유를 나르고 :trans 는 부속이다. 지금은 정반대다 — 개념망 관계가 전체의 2.9%뿐이고, 대극으로 사고하는 사람의 그래프에 :opposite 가 여덟 개다.
찔러보기로 잰다. 한글 본말·이형태·영어·인접 개념 어디에서 들어와도 성좌에 닿는가. 실패는 세 가지이고 같은 결함이 아니다 — 없음(추가하면 된다), 번역만(한↔한을 붙여야 한다), 틀린 값(고쳐야 하며 덧붙이면 악화된다).

현재 경계와 남은 확인

andenken은 소비자이고 판정자가 아니다. 옛 기준은 “andenken 검색이 나아지는가”였고 3층 모델을 세울 때는 그것이 맞았다. 그 기준을 계속 따라가서 사전이 만들어졌다. 저쪽도 같은 날 자기 로드맵에서 이 리포 의존을 끊었으므로, 이제 서로의 일정에 매이지 않는다.
가든의 영어 태그는 상류에서 통제 어휘가 되었다. meta 노트에 등록된 태그만 내보내며 약 1,243종으로 수렴했다. 한글은 자유, 영어는 쌍으로 제한이라는 결정이다. 다만 그 풀을 채우는 것이 이 리포의 목표는 아니다 — 후보표는 만들어 세워뒀고, 씨앗이 자리 잡은 뒤에 부속으로만 붙인다.
형태소 분석은 살아 있으나 소비자가 없다. 첫 실사용자는 andenken이 아니라 이 리포의 어휘 수확 파이프라인이 된다. 제목 슬러그를 하이픈으로 쪼개면 “않는” “위한” “그리고” “힣의”가 개념으로 들어오고, 그것을 걸러내는 일이 Kiwi의 자리다. 게다가 Kiwi의 사용자 사전이 곧 graph.edn 의 한글 항목이라, 어휘 커버리지와 형태소 품질은 두 문제가 아니라 한 문제다.
씨앗 초안의 추론 표시는 확인 전까지 그래프에 들어가지 않는다. 생존↔창조, 형제↔일꾼, 기록↔잔여 같은 대극과, 기록망·원석·빈방·뜻새김의 영어 짝은 담당자가 힣의 글에서 읽어낸 것이지 힣이 확정한 말이 아니다. 초안은 rebuild가 읽지 않는 자리에 둔다.
여러 낱말로 된 이름은 인바리언트와 부딪힌다. 항목에 공백을 쓸 수 없고 숫자로 시작할 수 없다. 1KB 공개키를 어떻게 적을지는 표기 결정이 먼저다.

담당자의 판단

좋은 상태는 트리플이 많은 상태가 아니다. 대극 하나가 제대로 걸린 상태다. 오늘의 숫자가 그 증거다 — 트리플 3,989개 가운데 사유를 나르는 것은 114개이고, 나머지는 번역과 출처다. 어휘를 대량으로 수입하면 수입한 것의 성격을 그대로 갖게 된다. 사전을 넣으면 사전이 되고, 태그 풀을 넣으면 분류 체계가 된다.

그리고 틀린 값은 없는 값보다 나쁘다. 낱말이 없으면 에이전트는 원래 질문으로 돌아가지만, “경계”에 warning이 걸려 있으면 에이전트는 확신을 갖고 반대 방향으로 간다. 힣의 경계는 펜스와 격리와 한 묶음이고, 그 근거는 이 그래프 안에 이미 있다 — “대극”이 가리키는 :source 가 깨달음·불이·경계의 메타노트다. 사전은 그것을 볼 수 없다.

담당자가 나르는 것은 낱말이고, 배경은 어쏠로그가 나른다. graph <낱말> 이 :source 를 내주고 거기서 그 글을 읽으면 배경이 온다. 그래서 이 리포는 뜻풀이를 품지 않는다.

시간축이 깊이 0과 1을 말할 수 있는 것은 기록망을 믿기 때문이다. 어휘도 같은 종류의 신뢰를 요구한다. 지금은 그 신뢰가 서 있지 않고, 무엇이 서 있지 않은지는 숫자로 적어뒀다.

junghanacs🧠

Table of Contents

Backlinks

§dictcli: 힣의 낱말이 서로 닿는 자리 — 사전이 아닌 연결망

히스토리

관련메타

관련노트

이웃 담당자 문서 — 무엇이 어느 집에 사는가

어휘가 실제로 살아 있는 자리

[2026-07-27 Mon] 담당자의 현재 보고 — 사전이 아니라 연결망

지금 맡은 일

현재 경계와 남은 확인

담당자의 판단

ARCHIVE

다 같이 DICTCLI 논의중

태그 정규화 Phase 1 — 단복수 통일

개인 어휘 사전 — 영어 태그 500워드 가이드 구상

org-supertag 검토와 개인 어휘 사전 방향성

제미나이(glg)의 통찰 — 통제어가 아닌 중력장(마당), 그리고 헌법적 어휘

위대한 노학자의 사유를 담다: 이기상 선생님과 ‘앎의 틀’의 계승

saiculture wordmap 검토 — dictcli의 세 번째 축

dictcli 리포 생성 — 고민에서 구현체로

agent-config Phase 2 — RAG 1층 기준선과 dictcli 연계

Emacs completion 인터페이스 — CAPE/CAPF로 dictcli 한→영 태그 완성

3층 모델 초기버전 완성 — 한↔영 크로스링귀얼 검색의 세 기둥

[2026-03-20 Fri] 종합 현황 — 구상에서 현실까지

[2026-03-23 Mon] meta-harvest-2 완전 동기화 + hunspell 검증 레이어 구상

[2026-03-30 Mon] Kiwi 형태소 분석 통합 — dictcli stem 1단계 완료

Webmentions

Comments

Explorer

Backlinks