insight
질문과 문서의 표현 격차
RAG를 만들었는데 "분명 문서에 있는데 검색이 못 찾는다"는 문제는 거의 모든 팀이 겪습니다. 생성 모델이 아무리 좋아도 검색이 관련 문맥을 못 가져오면 답은 무너집니다. 이 글에서는 벡터검색 정확도가 낮을 때…
— 최신 아티클
이번 주, 깊이 읽을 기술
질문과 문서의 표현 격차
RAG를 만들었는데 “분명 문서에 있는데 검색이 못 찾는다”는 문제는 거의 모든 팀이 겪습니다. 생성 모델이 아무리 좋아도 검색이 관련 문맥을 못 가져오면 답은 무너집니다. 이 글에서는 벡터검색 정확도가 낮을 때 점검할 원인을 우선순위대로 정리합니다. 원인 1~2: 청킹과 정제 문제 가장 흔한 원인은 검색이 아니라 그 앞 단계에 있습니다. 청크가 너무 커서 하나의 벡터에 여러 주제가 섞이면 임베딩이 흐려져 어떤 질문에도 어중간하게 매칭됩니다. 반대로 너무 작으면 핵심 문장이…
LLM 처음 다루는 개발자를 위한 토큰·컨텍스트 윈도우 완전 정리
LLM을 처음 도입할 때 가장 먼저 막히는 토큰, 컨텍스트 윈도우, 비용의 관계를 실무 관점에서 풀어 설명합니다.
실무에서 바로 쓰는 RAG 파이프라인 구축 단계별 튜토리얼
문서 적재부터 청킹, 임베딩, 검색, 생성까지 RAG 파이프라인 전 과정을 실무 기준으로 단계별 구성합니다.
벡터검색 정확도가 낮을 때 점검해야 할 7가지 원인
RAG에서 검색 결과가 엉뚱할 때 청킹, 임베딩, 거리 측정, 하이브리드 검색까지 단계별로 원인을 진단합니다.
임베딩 모델 선택 가이드: 한국어 RAG에서 무엇을 기준으로 고를까
차원 수, 다국어 지원, 비용, 벤치마크까지 임베딩 모델을 고를 때 실제로 봐야 할 기준을 비교합니다.
파인튜닝 vs 프롬프트 엔지니어링, 언제 무엇을 선택할까
비용, 데이터 양, 유지보수 관점에서 파인튜닝과 프롬프트 엔지니어링의 손익분기점을 비교 분석합니다.
— 지금 가장 많이 읽는
트렌딩 인덱스
조회수 집계 · 2026.06.27
관심사로 탐색하기
여섯 갈래로 정리한 데이터·AI의 지형도
— 뉴스레터
매주 목요일,
기술의 큰 그림을
이번 주 가장 중요한 기술 소식을 한 통의 메일로 정리해 보내드립니다.
e-wikidversity





