어느 개발자의 자료방

  • 홈
  • 태그
  • 방명록

빅데이터분석기사 2

[통계] Min Max 정규화

■ Min Max 정규화란 - 통계분석 목적 등에 의해 데이터를 0~1 사이 구간 분포로 변화화는 것. - 데이터 구간의 최소값이 0, 최대값을 1로 두어 데이터값을 0.xxxx 등으로 표현. - Max, Min 을 추출하는 과정에서 이상치 (Outlier) 값의 영향을 많이 받는다. - 비교적 간단한 수식으로 변수 처리가 가능하다.

Statistics 2023.04.01

[통계] 이상값 (Outlier)

이상값 (Outlier) 란 정상의 범주 (데이터의 전체적 패턴) 에서 벗아난 값. [주요 개념 정리] 단변수 이상치 (Univariate Outlier) : 하나의 데이터 분포에서 발생하는 이상치 다변수 이상치 (Multivariate Outlier) : 복수의 연결된 데이터 분포간에 발생하는 이상치 이상치 발생 원인 (비자연적 이상치) a. 입력실수 (Data Entry Error) b. 측정오류 (Measurement Error) : 측정장치 이상작동 (고장) c. 실험오류 (Experiment Error) : 실험환경에 따른 문제점 d. 의도적 이상치 (Intentional Outlier) : 자기 보고 측정 (Self-reported Measure) 에서 발생하여 의도가 포함된 이상치 e. 자료..

Statistics 2023.04.01
이전
1
다음
더보기
프로필사진

어느 개발자의 자료방

프로젝트 진행시 필요한 내용들을 정리하는 창고입니다.

  • 분류 전체보기 (33)
    • Database (16)
      • Connector (1)
      • MySQL (5)
      • MariaDB (2)
      • MongoDB (7)
    • Python (9)
    • OA (1)
    • System Appliation (1)
    • Statistics (6)
    • Computer Tips (0)

Tag

정규분포데이터생성, 빅데이터분석, BOXPLOT, MIN, max, 빅데이터분석기사, 데이터프레임, mongodb, 정규화, 파이썬, Python, CSV저장, MinMaxScaler(), index=False, mariaDB, 타이타닉, 표준정규분포, randn(n), JSON, mysql,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바