chroma ( 크로마 ) 활용한 자연어 유사도 분석 (No Embedding )
자연어를 조회하거나 활용할 때, 임베딩이 반드시 들어간다. 이때, 벡터 데이터베이스를 활용해 해당 문서를 조회하거나 찾는다. 벡터 데이터베이스라고 하면 낮설지만, 우리 주변에서 손쉽게 볼 수 있는 서비스로는 지도 서비스가 있다. 지도의 경우 위도, 경도라는 2D 벡터를 활용해 자신의 위치, 근처 맛집 등을 찾아주는 서비스이다. 이렇듯 우리 주변에서 쉽게 찾아 볼 수 있는 서비스지만, 낯선 기술이기도 한 벡터 데이터베이스와 임베딩에 대해 알아보겠다. 1. 임베딩이란? 임베딩(embedding)은 자연어 처리(Natural Language Processing) 분야에서 매우 중요한 개념이다. 간단히 말하면, 임베딩은 텍스트나 단어를 수치화된 벡터로 변환하는 기술이다. 자연어는 사람들이 의사소통하기 위해 사용..
2023.05.30