K-means 클러스터링을 이용한 압축 기반 이상탐지
http://www.ndsl.kr/ndsl/search/detail/article/articleSearchResultDetail.do?cn=JAKO201227932999832
본 연구는 대용량 로그 데이터를 저장하면서 동시에 이상 데이터를 탐지하는 새로운 방법을 제시합니다. 이를 위해 K-means 클러스터링 알고리즘을 이상탐지에 활용하였으며, 데이터 간 비유사도는 Logpack 압축 알고리즘으로 변환된 공간에서 계산됩니다. 또한 유전 알고리즘을 사용하여 이상 이벤트와 관련된 유의미한 특성 부분집합을 추출하는 특성 선택을 수행하였습니다. 다양한 실험을 통해 제안된 방법이 기존 알고리즘보다 우수한 성능을 보이는 것을 확인하였습니다.