[Python] Min-Max 정규화

Python

[Python] Min-Max 정규화

Any Developer 2023. 5. 9. 16:18

1. 목표

- 데이터의 Min-Max 정규화를 여러가지 방법에 의해 실행해 본다.

2. 도구

- Google Colaboratory

3. 사전 정보 확인

[Python] Z-Score 표준화 (tistory.com)

[Python] Z-Score 표준화

1. 목표 - Z-Score 표준화를 통해 표준정규분포를 나타낼 수 있다. 2. 도구 - Google Colaboratory [Python] 데이터 프레임 CSV 파일로 저장하기 (tistory.com) [Python] 데이터 프레임 CSV 파일로 저장하기 1. 목표 -

iotcyuty.tistory.com

- Z-Score 표준화에 이어 Mn-Max 정규화에 대해 다뤄볼 예정이다.

- 데이터셋은 위 포스팅에 저장된 CSV 파일로 해보도록 한다.

4. 코드 작성

'''
Min-Max 정규화 구하기
'''

import numpy as np  # 넘파이 임포트
import matplotlib.pyplot as plt  # 맷플롯립.파이플롯 임포트
import pandas as pd  # 판다스 임포트
from google.colab import drive


df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Sample_normaldistribution.csv')  # 정규분포 저장 데이터 불러옴

#### 공식에 의해 Min-Max 정규화 구함 ####

min_a = np.min(df["A"])
max_a = np.max(df["A"])

df["Min_Max_CALC_A"] = (df["A"]-min_a) / (max_a - min_a)

#### 결과 출력 ####
plt.hist(df["Min_Max_CALC_A"])
plt.show()

print("Min-Max 정규화를 거친 데이터의 최소값은 ", np.min(df["Min_Max_CALC_A"]), "이다.")
print("Min-Max 정규화를 거친 데이터의 최대값은 ", np.max(df["Min_Max_CALC_A"]), "이다.")

4.1. 코드 작성 (sklearn 이용)

'''
Min-Max 정규화 구하기
sklearn
'''

import numpy as np  # 넘파이 임포트
import matplotlib.pyplot as plt  # 맷플롯립.파이플롯 임포트
import pandas as pd  # 판다스 임포트
from google.colab import drive
from sklearn.preprocessing import MinMaxScaler


df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Sample_normaldistribution.csv')  # 정규분포 저장 데이터 불러옴

#### sklearn.preprocessing MinMaxScaler 를 이용해서 Min-Max 정규화 구함 ####

scaler = MinMaxScaler()  # 인스턴스 생성
df["Min_Max_SK_A"] = scaler.fit_transform(df[["A"]])  # Min-Max 정규화 실행


#### 결과 출력 ####
plt.hist(df["Min_Max_SK_A"])
plt.show()

print("Min-Max 정규화를 거친 데이터의 최소값은 ", np.min(df["Min_Max_SK_A"]), "이다.")
print("Min-Max 정규화를 거친 데이터의 최대값은 ", np.max(df["Min_Max_SK_A"]), "이다.")

'Python' 카테고리의 다른 글

[Python] 데이터 프레임 CSV 파일로 저장하기 (0)	2023.05.09
[Python] Z-Score 표준화 (0)	2023.05.09
[Python] 표준정규분포(정규분포) 데이터 생성 (0)	2023.05.09
[Python] Seaborn 패키지 (0)	2023.05.08
[Python] Matplotlib.pyplot 상자수염 그래프 그리기 (0)	2023.05.08

현재글[Python] Min-Max 정규화

어느 개발자의 자료방

프로젝트 진행시 필요한 내용들을 정리하는 창고입니다.

mysql, MIN, MinMaxScaler(), 데이터프레임, 정규화, randn(n), BOXPLOT, CSV저장, mongodb, 표준정규분포, Python, index=False, JSON, 타이타닉, max, 빅데이터분석, mariaDB, 정규분포데이터생성, 파이썬, 빅데이터분석기사,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

어느 개발자의 자료방