[통계] Min Max 정규화 ■ Min Max 정규화란 - 통계분석 목적 등에 의해 데이터를 0~1 사이 구간 분포로 변화화는 것. - 데이터 구간의 최소값이 0, 최대값을 1로 두어 데이터값을 0.xxxx 등으로 표현. - Max, Min 을 추출하는 과정에서 이상치 (Outlier) 값의 영향을 많이 받는다. - 비교적 간단한 수식으로 변수 처리가 가능하다. Statistics 2023.04.01
[통계] 이상값 (Outlier) 이상값 (Outlier) 란 정상의 범주 (데이터의 전체적 패턴) 에서 벗아난 값. [주요 개념 정리] 단변수 이상치 (Univariate Outlier) : 하나의 데이터 분포에서 발생하는 이상치 다변수 이상치 (Multivariate Outlier) : 복수의 연결된 데이터 분포간에 발생하는 이상치 이상치 발생 원인 (비자연적 이상치) a. 입력실수 (Data Entry Error) b. 측정오류 (Measurement Error) : 측정장치 이상작동 (고장) c. 실험오류 (Experiment Error) : 실험환경에 따른 문제점 d. 의도적 이상치 (Intentional Outlier) : 자기 보고 측정 (Self-reported Measure) 에서 발생하여 의도가 포함된 이상치 e. 자료.. Statistics 2023.04.01