지식 그래프 생명주기 (Brain)

스스로 정리하는 두 번째 뇌.

저장할 때마다 트리플이 추출되어 지식 그래프로 엮입니다. 에이전트는 이 온톨로지를 추론해 일합니다. 마크다운이 신피질이라면 RDF 그래프는 해마 색인입니다. 추출과 엔티티 해소, 커뮤니티 탐지, 재추출이 계속 도는 살아있는 그래프이고, 튜닝은 그래프가 자는 시간입니다.

기억 & 신경과학검색 & 그래프출처 & 사람글쓰기볼트

그래프는 어떻게 살아 움직이나

한 번의 빌드가 아니라 계속 도는 생명주기입니다. 추출 → 해소 → 커뮤니티 → 튜닝.

01

추출

저장할 때마다 도메인 어휘를 따르는 RAE(retrieval-augmented extraction)가 당신의 문장에서 엔티티와 관계 트리플을 길어냅니다. 디바운스, 바디 해시 게이트, 긴 노트 청킹으로 per-document 명명 그래프에 출처와 함께 쌓입니다.

02

해소

다른 이름으로 나타난 같은 엔티티를 union-find(표면형)와 임베딩, LLM 의미 판정으로 부드럽게 잇습니다. skos:exactMatch, broader, related 소프트 링크입니다. 언제든 되돌릴 수 있고, 파괴적 병합은 없습니다.

03

커뮤니티

Louvain 커뮤니티 탐지가 떠오른 주제를 찾아 토픽맵을 그립니다. LLM이 이름과 요약을 붙이고, 주제를 잇는 다리(bridge) 엔티티까지 드러납니다. 볼트의 큰 그림이 한눈에 보입니다.

04

튜닝 = 잠

그래프가 스스로를 청소하는 단계입니다. Auto-Tune이 볼트에서 페르소나와 엔티티 타입, 표준 술어를 도출해 추출에 되먹입니다. 동의어를 정리하고, 구조와 의미 기반 링크를 제안하고, 전체 또는 노트별 재추출을 돌립니다.

4-leg
어휘, 엔티티 임베딩, 트리플 임베딩, 밀집 패시지를 동시에 시딩
int8
양자화된 임베딩으로 인-메모리에서 빠르게 스캔
0
마크다운에 가해지는 변형. 그래프는 언제나 파생물입니다

뇌의 해부학

per-workspace Oxigraph

워크스페이스마다 Oxigraph/RocksDB 스토어에 RDF가 살고, .coherence/graph.nq로 이식 가능한 NQuads를 내보냅니다. git에서 그대로 diff하고, 언제든 당신의 글에서 다시 빌드합니다.

4-leg 융합 검색 + PPR

어휘 표면 매칭, 엔티티 라벨 임베딩, 질의를 트리플로 임베딩, 밀집 패시지가 동시에 그래프에 불을 붙입니다. Personalized PageRank가 활성을 확산한 뒤 BM25와 융합합니다.

int8 양자화 임베딩

임베딩 벡터를 int8로 양자화해 인-메모리에서 빠르게 스캔합니다. 긴 문서는 패시지 단위 임베딩과 BM25 전문 인덱스로 다룹니다.

Auto-Tune 도메인 페르소나

당신의 실제 볼트에서 도메인 페르소나와 엔티티 타입, 표준 술어를 도출해 추출에 되먹입니다. 어휘가 분열하지 않고 수렴하며, 스테일니스를 추적합니다.

지식 그래프 튜닝 다이얼로그

Lifecycle, Topic Map, Vocab, Synonyms, Suggestions, Re-Extract. 그래프의 생명주기 전체를 한 다이얼로그에서 보고, 손보고, 다시 돌립니다.

마크다운은 절대 변형되지 않음

노트는 시스템이 손대지 않는 단일 출처(신피질)입니다. 그래프와 임베딩, 커뮤니티 리포트는 모두 파생물입니다. Consilience를 지워도 당신의 .md는 그대로 남습니다.

신피질에서 잠까지

사람이 배우고, 색인하고, 공고화하고, 잠으로 정리하듯 그래프도 같은 단계를 밟습니다.

신피질
Neocortex

마크다운, 내구성 있는 명시적 기억

디스크의 평범한 .md 파일입니다. 시스템이 절대 변형하지 않는 단일 출처이고, 이식 가능하며 diff 가능하고 미래에도 열립니다.

해마 색인
Hippocampal index

RDF 그래프, 연상과 패턴 완성

임베딩과 Personalized PageRank를 얹은 RDF 지식 그래프입니다. 단순 매칭이 아니라 연상으로 떠올리는 해마 색인 역할을 합니다.

기억 공고화
Consolidation

엔티티 해소, 되돌릴 수 있는 소프트 링크

다른 이름의 엔티티를 union-find와 임베딩, LLM 판정으로 부드럽게 잇습니다. 출처는 살아남고, 병합은 언제든 되돌릴 수 있습니다.

Sleep

튜닝, 스스로를 청소하는 그래프

Auto-Tune과 동의어 관리, 제안 링크(Adamic-Adar와 의미 후보), 재추출이 돕니다. 추출이 한 번의 빌드가 아니라 계속 도는 생명주기인 이유입니다.

당신의 노트로 두 번째 뇌를 길러보세요

로컬 우선, BYOK. 평범한 마크다운으로 그래프를 편집하면, 에이전트가 그 위에서 추론합니다.