이상 탐지의 분류(Classification of Anomaly Detection)

2021. 12. 31. 18:07Research/Anomaly Detection

이상 탐지(Anomaly Detection)는 정상인 데이터(Normal Sample Data)들 사이에서 비정상인 데이터(Abnormal Sample Data)를 탐지하는 연구 분야를 말합니다. 이상 탐지는 교통 분야(Illegal Traffic Flow Detection), 의료 분야(Detecting Retinal Damage), 통신 분야(Cyber-Network Intrusion Detection), IoT 분야(Internet of Things Big - Data Anomaly Detection)에서 활발하게 쓰이고 있습니다. 이상치(Abnormal Sample)는 그 시스템의 이상 현상에 대한 정보를 제공해주기 때문에 이상치를 탐지하고 이를 분석하는 것은 중요한 문제라고 할 수 있습니다[1].


이상 탐지는 데이터 라벨을 제공해주느냐에 따라 Supervised, Semi-Supervised, Un-Supervised로 나눌 수 있습니다. 이번글에서는 각각의 방식을 정의하고 간단한 특징에 대해 알아보겠습니다[1].

1. Supervised Anomaly Detection

  Supervised Anomaly Detection은 데이터 샘플이 정상인지 비정상인지에 대한 라벨을 제공해주는 방식을 말합니다. 각 데이터 샘플이 정상인지 아닌지에 대한 정보를 학습하므로 Un-Supervised, Semi-Supervised 방식보다 정확도가 높은 것이 특징입니다. 하지만 반대로 말하면, 모든 데이터 샘플에 대해 라벨이 필요하므로(데이터 샘플에 대한 라벨을 지정하는 것이 비용이 많이 들고, 정답 라벨의 클래스가 여러 개인 경우 정상인지 비정상인지에 대한 결정이 불가능할 수도 있음) 대부분의 방식에서 쓰일 수 없다는 특징을 가지고 있습니다.

2. Semi-Supervised Anomaly Detection

Semi-Supervised Anomaly Detection은 데이터 샘플들을 하나의 클래스로 분류한 후 그 클래스에 대한 경계(Boundary)를 만들어 경계 밖의 데이터 샘플에 대해서는 비정상으로 분류하는 방식을 말합니다. 대표적인 모델로 Deep Support Vector Data Description (Deep SVDD)[2]가 있습니다. 

Figure From [2].

위 논문에서는 Semi-Supervised 방식 중 하나인 SVDD(Support Vector Data Description)를 신경망을 이용해서 구현하였습니다. SVDD에서는 데이터를 구분하는 결정경계를 초구(Hyper-Sphere)를 이용해 만들게 됩니다. SVDD에서는 초구를 만들기 위해 커널(Kernel)을 이용해서 높은 차원으로 매핑(Mapping)시키게 되는데, 위 논문에서 제안한 Deep SVDD는 신경망을 이용해 커널을 구현하였습니다.

 3. Un-Supervised Anomaly Detection

Un-Supervised Anomaly Detection은 데이터 샘플에 대한 클래스를 따로 지정하지 않는 경우를 말합니다. 대표적인 모델로 Auto-Encoder가 있습니다. 

Figure From [3].

 위 논문에서는 AnoGAN이 높은 해상도를 가지는 brain MR image의 UAD(Un-Supervised Anomaly Detection) Task에서 수용력이 부족하다는 점을 보완하기 위해 spatial VAE모델을 사용하였습니다. 위 논문에서 제안된 모델처럼 정상 데이터를 입력으로 넣고 정상 데이터를 재건(Reconstruction)하도록 학습시키면 비정상 데이터를 넣었을 때 출력 값이 정상 데이터를 입력으로 했을 때와는 다를 것 입니다. 그것을 이용해 Anomaly Detection Task를 수행하게 됩니다.

[참고 문헌]

[1] CHALAPATHY, Raghavendra; CHAWLA, Sanjay. Deep learning for anomaly detection: A survey. arXiv preprint arXiv:1901.03407, 2019.

[2] RUFF, Lukas, et al. Deep one-class classification. In: International conference on machine learning. PMLR, 2018. p. 4393-4402.

[3] BAUR, Christoph, et al. Deep autoencoding models for unsupervised anomaly segmentation in brain MR images. In: International MICCAI Brainlesion Workshop. Springer, Cham, 2018. p. 161-169.