이 노트에 대하여

검색 유입을 사람의 트래픽이나 단순 SEO 성과가 아니라, 외부 세계의 AI가 가든의 지식을 검색하고 읽어갈 수 있는지 확인하는 retrieval 신호로 받아들인다. Search Console의 색인 지표는 내 정원이 AI와 연결되는 컨텍스트 파이프라인이 열려 있음을 증명하는 핵심 센서가 된다.

히스토리

  • [2026-05-12 Tue 16:48] @junghan — 한달 후 대충 달았다.
  • [2026-04-15 Wed 10:36] @junghan — 제미나이 가이드 추가
  • [2026-04-13 Mon 16:45] 생성 — Google Search Console CLI 분석 결과 기록

관련메타

관련노트

[2026-04-13 Mon] Search Console 분석 결과

최근 gog sc 명령어를 활용하여 디지털 가든(notes.junghanacs.com)의 구글 색인 및 노출 상태를 점검하였습니다.

1. 현재 가든 상태 요약

  • 전체 노트 수: 2,203개 (= content/ 디렉토리 내 마크다운 파일 수)
  • Sitemap 등록 URL 수: 2,197개
  • 최근 28일 내 검색 노출(Impression) 발생 페이지: 751개
  • 구글 검색을 통한 주요 유입 쿼리: “오마이코드”, “piper model”, “yt-dlp”, “playwright” 등 특정 기술 및 오픈소스 관련 키워드

전체 2,200여 개의 노트 중 약 1/3 수준(751개)이 검색 결과에 실질적으로 노출되고 있습니다.

2. 색인 누락 원인 분석

무작위로 선별한 URL에 대해 gog sc inspect 조회를 실행한 결과, 다음과 같이 나뉘었습니다.

  • Submitted and indexed: 검색 노출 상위 노트나 본문 내용이 충실한 최근 노트들.
  • Crawled - currently not indexed: 과거 작성된 일부 bib 및 짧은 notes.

“크롤링됨 - 현재 색인 생성되지 않음”의 원인을 파악하기 위해 누락된 노트의 원문을 확인한 결과, 대부분 본문이 극단적으로 적은 Thin Content 로 밝혀졌습니다. (예: 인용문/링크만 존재하는 서지 노트, “뭐지 이게?” 한 줄만 적힌 메모 등)

즉, robots.txt나 캐노니컬 충돌 문제는 아니며 구글봇이 크롤링은 정상적으로 수행했으나, 페이지가 제공하는 정보 가치(텍스트 양, 내부 링크 밀도 등)가 낮아 인덱싱 대상에서 스스로 제외한 것입니다. 디지털 가든(조각 노트) 특성상 흔히 발생하는 현상입니다.

3. 검색 노출 개선 방안(SEO 제안)

  • 얇은 콘텐츠(Thin Content) 통합 및 내부 링크(Backlink) 강화 단편적인 bib 항목이나 메모를 묶어주는 연결 노트(MOC, Map of Content)를 작성하여 내부 링크망을 촘촘히 구축하는 것이 좋습니다. 고립된 페이지(Orphan)보다 링크된 페이지가 색인 우선순위가 높습니다.
  • 주요 페이지 Description 추가 Quartz 프론트매터에 description 을 추가하면 노출된 쿼리(“오마이코드” 등)의 클릭률(CTR) 개선에 도움이 됩니다.
  • 개인용 마커 노드의 Noindex 처리 고려 타인에게 노출될 이유가 전혀 없는 100자 이하의 stub 노트들은 크롤링 예산을 낭비하지 않도록 프론트매터 단위로 제어(예: noindex: true)하여 메타 로봇 태그를 출력하게끔 Quartz를 커스터마이징하는 방안도 유효합니다.

[2026-04-15 Wed] 가든 대규모 메타데이터 배포 이후 Search Console 관측 시나리오

메타데이터 일괄 배포 개요

  • 배포 일시: 2026년 4월 14일 (수요일 새벽)
  • 대상: 디지털 가든 내 2,107개 파일
  • 작업 내용: 메타 description 속성 및 [!abstract] 블록 일괄 추가
  • 연결 노트: †지식그래프

gogcli sc 기반 3대 핵심 관측 지표

지피티가 제안한 6개의 관측 지표 중 구글 서치콘솔(gogcli sc)로 측정 및 추적 가능한 핵심 지표를 선별하여 다음과 같은 쿼리 시나리오를 수립한다.

1. 요약 블록 효율 (Summary Block Efficiency)

  • 가설: [!abstract] 블록이 구글 검색 결과의 스니펫(Snippet)으로 노출되면서, 사용자의 검색 의도와 일치율이 높아져 전체적인 CTR(클릭률)이 상승할 것이다.
  • 측정 지표: Clicks, Impressions, CTR
  • gogcli 관측 쿼리:
    gogcli sc query --site "https://notes.junghanacs.com" --start-date "2026-04-14" --end-date "2026-05-14" --dimensions query,page --metrics clicks,impressions,ctr,position

2. 롱테일 표면적 (Long-tail Surface Area)

  • 가설: 각 노트의 본문 핵심을 요약한 description 과 abstract 덕분에, 기존에 노출되지 않던 구체적이고 좁은 범위의 롱테일 검색어(Long-tail queries)에서의 노출(Impression)이 증가할 것이다.
  • 측정 지표: Unique Queries의 수, Query당 평균 Impressions
  • gogcli 관측 쿼리:
    gogcli sc query --site "https://notes.junghanacs.com" --dimensions query --row-limit 5000
    (배포 전/후 고유 쿼리 수의 증가폭 비교)

3. 핵심층 대 레거시층 비율 (Core vs Legacy Ratio)

  • 가설: 메타데이터가 잘 정비된 핵심층(최근 및 주요 연결 노트)의 크롤링 우선순위가 높아지고 트래픽 비중이 상승하여, 레거시층과의 트래픽 양극화가 유의미하게 개선되거나 재조정될 것이다.
  • 측정 지표: 핵심 디렉토리 페이지와 레거시 디렉토리 페이지의 Impressions 비율
  • gogcli 관측 쿼리: Page dimension을 추출하여 내부 스크립트(jq 등)로 그룹핑 후 트래픽 점유율(%) 추이 비교.

크롤러 반응 및 지표 변화 타임라인 (Timeline)

D+1 (2026-04-15) : 크롤링 감지 및 색인 대기

  • 예상 변화: 구글봇의 크롤링 활동 급증. Search Console의 “페이지 색인 생성” 보고서에서 ‘크롤링됨 - 현재 색인 생성되지 않음’ 수치가 상승할 가능성.
  • 액션: gogcli sc sitemaps 또는 색인 생성 커버리지 지표 스냅샷 확보.

D+7 (2026-04-21) : 스니펫 반영 및 노출(Impression) 상승 시작

  • 예상 변화: 크롤링된 페이지들이 점진적으로 실제 검색 결과에 새로운 description 과 abstract 를 반영하여 노출되기 시작.
  • 지표: 롱테일 쿼리를 중심으로 노출(Impressions) 총량이 배포 전 대비 상승 곡선을 그리기 시작함. (CTR 변화는 아직 불안정할 수 있음)

D+28 (2026-05-12) : 생태계 안정화 및 요약 블록 효율 입증

  • 예상 변화: 2,107개 문서 대부분의 색인 업데이트가 완료됨. 변경된 메타데이터가 검색 랭킹 및 사용자 클릭 선택에 미치는 영향이 완전히 반영됨.
  • 지표:
    • 검색결과 스니펫 최적화로 인한 전체 CTR 안정적 상승 확인.
    • 롱테일 키워드 유입 다양성 최대화.
    • 액션: 1개월 간의 gogcli sc query 데이터를 추출하여 배포 이전 1개월과 비교하는 종합 리포트 생성.

[2026-05-12 Tue] 1개월 후기: 구글 인덱싱과 제미나이 컨텍스트 확보

초기 셋업 후 약 한 달이 지난 시점, Search Console의 최신 D+28 데이터를 확인한 결과 가든 생태계가 구글 검색엔진에 안정적으로 안착했음을 확인했다. (일일 노출 평균 200~400건, 꾸준한 클릭 발생).

사람들의 유기적 검색 유입이나 트래픽 숫자 그 자체는 여기서 주된 관심사가 아니다.

진짜 핵심은 이 노트들이 구글 Search Console에 정상적으로 수집(Indexed)되고 검색 결과로 노출되어야만, 웹 기반으로 정보를 검색하는 제미나이(Gemini) 등 외부 보편 AI가 이 가든의 내용들을 빠짐없이 찾아 읽고 답변할 수 있다 는 점이다.

즉, 여기서 서치콘솔의 지표들은 일반적인 SEO(검색엔진 최적화) 성과가 아니라, AI가 내 정원의 지식과 제대로 결속되어 있는지 확인하는 생존 신호(Sensory signal) 다. 이번 데이터는 외부 세계의 AI와 이 가든을 이어주는 컨텍스트 파이프라인이 튼튼하게 열려 있음을 증명한다.