TadGAN: 논문 자료
Time Series Anomaly Detection Using Generative Adversarial Networks
원문 : https://arxiv.org/abs/2009.07769
스마일게이트AI - 시계열 데이터 분석_TadGAN
원문 : https://smilegate.ai/2021/06/01/tadgan/
TadGAN 동작 원리[학습과 예측]
Train 데이터를 기반으로 Reconstructed data를 구축하고, 새로운 데이터가 들어오면 기 구축된 Reconstructed data와 새로운 데이터 사이에 이상 구간을 탐지하여 Anomaly error score를 계산하고 threshold에 맞게 이상탐지 구간을 탐지합니다.
TadGAN 전체 프로세스
1. 데이터 전처리
정해진 초 단위로 훈련 샘플을 얻기 위해 original 시계열 데이터를 신호 세그먼트로 나누기 위해 슬라이딩 윈도우를 도입합니다.
2. 모델 훈련
Critic X: 실제 데이터와 랜덤 데이터를 Generator로 바꾼 데이터를 구별하도록 훈련 / Critic Z: 램덤 데이터와 실제 데이터를 Encoder로 바꾼 데이터를 구별하도록 훈련하여 Reconstruction data 구축을 완료합니다.
3. 예측
Original data 기준으로 reconstructed data가 잘 구축된 것을 볼 수 있습니다.
4. 에러 계산
실제 데이터와 Reconstruction 데이터의 차이를 계산하도록 합니다. Critic Score는 앞에서 훈련한 Critic 점수를 에러 계산에 활용하여 주어진 데이터가 얼마나 진짜와 비슷한지 표현하는 점수 입니다.
5. Threshold 설정
아래 빨간색 Error score가 threshold 기준으로 얼마나 크게 넘어섰는지를 설정하고 Anomaly의 정도를 감지합니다.
6. Anomaly 감지
TadGAN의 우수성
Timeseries Anomaly Detection GAN, 시계열 데이터 이상탐지에 최적화된 GAN 모델로 다른 이상탐지 모델에 비해 우수한 성능을 내고 있으며 다양한 분야에 인정받고 있습니다.
'Data Science > Anomaly Dectection' 카테고리의 다른 글
Best Anomaly Detection Library : Kats, ARUNDO-ADTK, PyOD, Luminaire (0) | 2022.04.21 |
---|---|
Python Anomaly Detection Library : Kats (0) | 2022.04.21 |
Anomaly Detection Python Library : Arundo-adtk (0) | 2022.04.18 |
Time Series Data Anomaly Detection (시계열 데이터 이상 탐지) (0) | 2022.01.24 |
Autoencoder based Anomaly Detection (0) | 2022.01.24 |
최근댓글