Post

(Sparta_WIL_04) 스프링 AI

(Sparta_WIL_04) 스프링 AI

1. Log

1. New Keyword

  • Agentic -> LLM을 사용하는 방법론
  • VectorDB -> 벡터 디비 데이터 저장!

2. 문제의 기록

  • Agentic / tocken
    • 계속 고민이 되는 부분이고 생각해야하는 부분
    • “토큰을 적게 사용해야 경제적이고 효과적”이다라는 말이 너무 어려움
    • 같은 상황에서 한번의 질문으로 답이 나오면 좋지만,
      • LLM이 그렇게 쉽게 답을 주지 않기 때문에 반복적으로 질문을 해야하는데.
      • 사용자 입장에서는 똑같은걸 여러번 요구하기가 애매한 상황이고
      • 그렇다면 처음부터 단계를 거쳐서 명확한 답변을 얻어내는 것이 현명.
      • 하지만 한번에 답을내는게 훨씬 좋기는 하다.
      • 어렵다!!!!!!!
  • 옵셔널 / 람다 관련해서 쪼금더 메모가 필요할듯.
    • 프로젝트 진행하면서 별도의 해석이나 검색없이 읽는 것까지는 감을 잡은것 같은데,
    • 직접 사용하려니 막막함.
    • 이 부분에 대한 기본기가 부족한듯!
  • VectorDB
    • 간단한 것 같으면서도 복잡한 듯함.
    • 테이블에 벡터화시켜서 데이터 넣는 것과 메타데이터를 넣는 것이 거의 전부
    • 조회할때 유사도 판단은 0으로 조회해서 그 사이가 어디인지 판단하는게 현명할듯
      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      
      -> Q) 자전거 용품 조회할때
      -> VectorDB 결과 값
      가민 엣지 530 / 자전거 카테고리        distance=0.52  →  similarity=0.48
      자이언트 탈론 / 자전거 카테고리         distance=0.53  →  similarity=0.47
      삼천리 로드바이크 / 자전거 카테고리      distance=0.54  →  similarity=0.46
      신지케이트 자물쇠 / 자전거 카테고리      distance=0.56  →  similarity=0.44
      카스크 헬멧 / 자전거 카테고리           distance=0.62  →  similarity=0.38
        
                 >>> 이 사이가 자전거 조회의 기준점 0.37 ~ 0.23 <<<   
      
      가민 인스팅트2 / 등산 카테고리          distance=0.76  →  similarity=0.24
      헬리녹스 체어원 / 등산 카테고리         distance=0.80  →  similarity=0.20
      살로몬 X울트라4 / 등산 카테고리 등산화   distance=0.81   →  similarity=0.19
      
This post is licensed under CC BY 4.0 by the author.