Python

[Python] 표준정규분포(정규분포) 데이터 생성

Any Developer 2023. 5. 9. 11:56

1. 목표

 - 표준 정규분포 데이터를 생성한다.

 - 향후 이 데이터로 테스트 셋을 설정하여 통계학적 접근을 이끌어 낸다.

 

2. 도구

 - Google Colaboratory

 

3. 코드

 

'''
정규분포 데이터 (테스트 셋) 생성하기
'''

import numpy as np  # 넘파이 임포트
import matplotlib.pyplot as plt  # 맷플롯립.파이플롯 임포트
import pandas as pd  # 판다스 임포트


##### 입력 변수 선언 ######
mean_a, std_a = 50.0, 4  # 그룹 a 의 평균, 표준편차 입력
mean_b, std_b = 42.5, 3.2  # 그룹 b 의 평균, 표준편차 입력

##### 표준정규분포데이터 랜덤 생성 ######
s_nordist_a = np.random.randn(2000)  # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
s_nordist_b = np.random.randn(2000)  # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성

##### 정규분포데이터 로 변환 ######
### 정규분포 = 표준편차 * 표준정규분포 + 평균값
nordist_a = std_a * s_nordist_a + mean_a   # 평균, 표준편차가 고려된 정규분포데이터로 변환
nordist_b= std_b * s_nordist_b + mean_b   # 평균, 표준편차가 고려된 정규분포데이터로 변환

##### 데이터 히스트로그램 그리기 ######
plt.hist(nordist_a)
plt.title("Normal Distribution of group a")
plt.show()

plt.hist(nordist_b)
plt.title("Normal Distribution of group b")
plt.show()

df = pd.DataFrame({"A":nordist_a, "B":nordist_b})  # 판다스 데이터프레임 형태로 타입 변환

##### 기타 정보 확인 ######
print(type(nordist_a))  ## 데이터 타입 확인
df.head(20)  ## 상위데이터 20개 출력 확인

 

정규 분포 - 위키백과, 우리 모두의 백과사전 (wikipedia.org)

 

정규 분포 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포

ko.wikipedia.org