추출
저장할 때마다 도메인 어휘를 따르는 RAE(retrieval-augmented extraction)가 당신의 문장에서 엔티티와 관계 트리플을 길어냅니다. 디바운스, 바디 해시 게이트, 긴 노트 청킹으로 per-document 명명 그래프에 출처와 함께 쌓입니다.
지식 그래프 생명주기 (Brain)
저장할 때마다 트리플이 추출되어 지식 그래프로 엮입니다. 에이전트는 이 온톨로지를 추론해 일합니다. 마크다운이 신피질이라면 RDF 그래프는 해마 색인입니다. 추출과 엔티티 해소, 커뮤니티 탐지, 재추출이 계속 도는 살아있는 그래프이고, 튜닝은 그래프가 자는 시간입니다.
한 번의 빌드가 아니라 계속 도는 생명주기입니다. 추출 → 해소 → 커뮤니티 → 튜닝.
저장할 때마다 도메인 어휘를 따르는 RAE(retrieval-augmented extraction)가 당신의 문장에서 엔티티와 관계 트리플을 길어냅니다. 디바운스, 바디 해시 게이트, 긴 노트 청킹으로 per-document 명명 그래프에 출처와 함께 쌓입니다.
다른 이름으로 나타난 같은 엔티티를 union-find(표면형)와 임베딩, LLM 의미 판정으로 부드럽게 잇습니다. skos:exactMatch, broader, related 소프트 링크입니다. 언제든 되돌릴 수 있고, 파괴적 병합은 없습니다.
Louvain 커뮤니티 탐지가 떠오른 주제를 찾아 토픽맵을 그립니다. LLM이 이름과 요약을 붙이고, 주제를 잇는 다리(bridge) 엔티티까지 드러납니다. 볼트의 큰 그림이 한눈에 보입니다.
그래프가 스스로를 청소하는 단계입니다. Auto-Tune이 볼트에서 페르소나와 엔티티 타입, 표준 술어를 도출해 추출에 되먹입니다. 동의어를 정리하고, 구조와 의미 기반 링크를 제안하고, 전체 또는 노트별 재추출을 돌립니다.
워크스페이스마다 Oxigraph/RocksDB 스토어에 RDF가 살고, .coherence/graph.nq로 이식 가능한 NQuads를 내보냅니다. git에서 그대로 diff하고, 언제든 당신의 글에서 다시 빌드합니다.
어휘 표면 매칭, 엔티티 라벨 임베딩, 질의를 트리플로 임베딩, 밀집 패시지가 동시에 그래프에 불을 붙입니다. Personalized PageRank가 활성을 확산한 뒤 BM25와 융합합니다.
임베딩 벡터를 int8로 양자화해 인-메모리에서 빠르게 스캔합니다. 긴 문서는 패시지 단위 임베딩과 BM25 전문 인덱스로 다룹니다.
당신의 실제 볼트에서 도메인 페르소나와 엔티티 타입, 표준 술어를 도출해 추출에 되먹입니다. 어휘가 분열하지 않고 수렴하며, 스테일니스를 추적합니다.
Lifecycle, Topic Map, Vocab, Synonyms, Suggestions, Re-Extract. 그래프의 생명주기 전체를 한 다이얼로그에서 보고, 손보고, 다시 돌립니다.
노트는 시스템이 손대지 않는 단일 출처(신피질)입니다. 그래프와 임베딩, 커뮤니티 리포트는 모두 파생물입니다. Consilience를 지워도 당신의 .md는 그대로 남습니다.
사람이 배우고, 색인하고, 공고화하고, 잠으로 정리하듯 그래프도 같은 단계를 밟습니다.
디스크의 평범한 .md 파일입니다. 시스템이 절대 변형하지 않는 단일 출처이고, 이식 가능하며 diff 가능하고 미래에도 열립니다.
임베딩과 Personalized PageRank를 얹은 RDF 지식 그래프입니다. 단순 매칭이 아니라 연상으로 떠올리는 해마 색인 역할을 합니다.
다른 이름의 엔티티를 union-find와 임베딩, LLM 판정으로 부드럽게 잇습니다. 출처는 살아남고, 병합은 언제든 되돌릴 수 있습니다.
Auto-Tune과 동의어 관리, 제안 링크(Adamic-Adar와 의미 후보), 재추출이 돕니다. 추출이 한 번의 빌드가 아니라 계속 도는 생명주기인 이유입니다.