1. 목표
- 표준 정규분포 데이터를 생성한다.
- 향후 이 데이터로 테스트 셋을 설정하여 통계학적 접근을 이끌어 낸다.
2. 도구
- Google Colaboratory
3. 코드
'''
정규분포 데이터 (테스트 셋) 생성하기
'''
import numpy as np # 넘파이 임포트
import matplotlib.pyplot as plt # 맷플롯립.파이플롯 임포트
import pandas as pd # 판다스 임포트
##### 입력 변수 선언 ######
mean_a, std_a = 50.0, 4 # 그룹 a 의 평균, 표준편차 입력
mean_b, std_b = 42.5, 3.2 # 그룹 b 의 평균, 표준편차 입력
##### 표준정규분포데이터 랜덤 생성 ######
s_nordist_a = np.random.randn(2000) # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
s_nordist_b = np.random.randn(2000) # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
##### 정규분포데이터 로 변환 ######
### 정규분포 = 표준편차 * 표준정규분포 + 평균값
nordist_a = std_a * s_nordist_a + mean_a # 평균, 표준편차가 고려된 정규분포데이터로 변환
nordist_b= std_b * s_nordist_b + mean_b # 평균, 표준편차가 고려된 정규분포데이터로 변환
##### 데이터 히스트로그램 그리기 ######
plt.hist(nordist_a)
plt.title("Normal Distribution of group a")
plt.show()
plt.hist(nordist_b)
plt.title("Normal Distribution of group b")
plt.show()
df = pd.DataFrame({"A":nordist_a, "B":nordist_b}) # 판다스 데이터프레임 형태로 타입 변환
##### 기타 정보 확인 ######
print(type(nordist_a)) ## 데이터 타입 확인
df.head(20) ## 상위데이터 20개 출력 확인


정규 분포 - 위키백과, 우리 모두의 백과사전 (wikipedia.org)
정규 분포 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 확률론과 통계학에서 정규 분포(正規 分布, 영어: normal distribution) 또는 가우스 분포(Gauß 分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포
ko.wikipedia.org
'Python' 카테고리의 다른 글
[Python] 데이터 프레임 CSV 파일로 저장하기 (0) | 2023.05.09 |
---|---|
[Python] Z-Score 표준화 (0) | 2023.05.09 |
[Python] Seaborn 패키지 (0) | 2023.05.08 |
[Python] Matplotlib.pyplot 상자수염 그래프 그리기 (0) | 2023.05.08 |
[Python] Matplotlib.pyplot 히스토그램 그래프 그리기 (0) | 2023.05.08 |