Research(8)
-
[Workshop] 'LLM을 활용한 RAG 구현하기' 워크샵 후기 및 내용 공유
튜링의 사과와 프로그래머스가 주최한 'LLM을 활용한 RAG 구현하기' 워크샵에 다녀왔습니다. 2023년 12월 21일 목요일 오후 7시 30분 부터 오후 10시까지 강남역 프로그래머스 강의장에서 진행하였습니다. 워크샵은 튜링의 사과 운영진 대표이신 조한열 대표님께서 진행해주셨습니다. 워크샵 내용은 기본적인 RAG에 대한 설명과 간단한 실습이였습니다. 워크샵은 'RAG가 이런 것이구나'라고 느끼기에 충분한 난이도와 내용이었던 것 같습니다. 워크샵에서 진행했던 코드에 대해 간단하게 설명하겠습니다. (코드 공개에 대해 조한열 대표님께 허락을 맡았습니다.) 우선 transformer와 chromadb를 설치합니다. transformer 라이브러리는 허깅페이스의 pretrained 모델을 이용할 수 있게 해줍니..
2023.12.22 -
Continual Learning - Survey
본 글은 Continual Learning에 대한 Survey를 정리한 글이며, [1]을 참고하였습니다. Background '과제'(Task)라는 개념은 새로운 클래스 그룹, 새로운 도메인 또는 다른 출력 공간에 속하는 새로운 데이터 배치가 있는 격리된 교육 단계를 나타냅니다. Continual Learning은 문헌에 따라 다르게 표현(e.g. Lifelong Learning, Incremental Learning)되기도 합니다. Continual Learning Scenario Task IL 입력 이미지와 어떤 태스크 인지가 주어지고, 그것이 첫 번째 클래스인지 두 번째 클래스 인지를 맞추는 문제입니다. Class IL 입력 이미지만 주어졌을 때, 어떤 클래스 인지를 맞추는 문제입니다. Domain..
2023.02.18 -
Continual Learning - Motivation
Motivation 서비스를 개발하여 배포하는 과정은 아래의 그림과 같습니다. 배포하였던 서비스에 문제가 생겨서 문제를 해결하려고 노력하였는데, 문제가 해결되면 다행입니다만.. 대부분의 경우는 지루한 디버깅 과정이 계속 되게 됩니다. 지루한 것도 문제이지만, 더 중요한 것은 모델의 문제점을 찾고 재배포하는 일련의 과정들이 다 비용이라는 것입니다. 비용을 줄이기 위해선 새로운 분포를 가진 데이터가 들어왔을 때, 새로운 데이터에 맞도록 자동적으로 모델을 수정하여 배포해야합니다. 연구 목적 Continual Learning은 기존 데이터 분포와 다른 새로운 분포를 가진 데이터가 들어왔을 때, 기존 모델을 업데이트 시키는 것을 다루는 분야입니다. 현재 솔루션이 배포되고 있는 상황은 지속적으로 새로운 분포를 가진..
2023.02.18 -
BALD(Bayesian Active Learning Disagreement) 논문 해석
Active Learning 이미지를 활용한 모델링을 진행하다보면, 비용이 많이 드는 라벨링 작업이 문제가 될 때가 많습니다. 그렇기 때문에 적은 라벨링으로 높은 성능을 기록할 수 있는 모델을 만드는 것이 비용 측면에서 효율적입니다. Active Learning은 라벨링을 진행하지 않은 샘플들 중 정보가 많이 담겨있는 샘플을 선정하는 것을 목표로하는 분야입니다. Bayesian Active Learning Bayesian Active Learning은 Active Learning의 한 갈래로, 정보가 많이 담겨있는 샘플을 선정할 때, Bayesian 방법론을 사용합니다. 즉, 라벨링을 진행하지 않은 샘플들의 불확실성을 Bayesian 방법론을 통하여 측정하고, 불확실성이 높은 샘플들을 먼저 라벨링 해야할..
2023.01.24 -
[Research] Semantic Segmentation Survey 정리
Model 설명 정리 Learning Based Semantic Segmentation을 구조 및 특징에 따라 8가지 경우로 분류할 수 있다. Fully Convolutional Models CNNs with Graphical Models Convolution연산의 경우, location in-variance, scale variance한 특징을 가지기 때문에 Classification Task와 같이 Semantic Feature가 중요한 경우 높은 성능을 달성할 수 있다. 하지만, Spatial Feature가 중요한 Segmentation, Detection Task에는 적합하지 않을 수 있다. 손실된 Spatial Feature을 복원하기 위해 CRF(Conditional Random Field)..
2022.10.22 -
CutPaste: Self-Supervised Learning for Anomaly Detection and Localization 리뷰
Anomaly Detection Task에서 간단한 Pre-Taxt Task를 통해서 Self-Supervised Learning을 설계하고 이를 통해 좋은 성능을 얻고 있는 Cutpaste모델에 대해 리뷰해보려고 합니다. Introduction Anomaly Detection는 정상이미지에서 다른 패턴을 찾아내는 것을 목적으로 합니다. Anomaly Detection은 공정 이상 탐지, 의료 영상 분석, 비디오 감시 등에서 쓰이고 있습니다. 기존의 지도학습과는 다르게 Anomaly Detection은 고유의 문제점을 가지고 있습니다. 첫번째는 비정상 데이터를 많이 구할 수 없다는 것 입니다. 즉, 정상 데이터만을 활용하여 다양한 패턴의 비정상 데이터를 찾아내야한다는 것 입니다. 두번째는 정상 데이터와 ..
2022.08.20