Python
[Python] 데이터 프레임 CSV 파일로 저장하기
Any Developer
2023. 5. 9. 13:05
1. 목표
- 파이썬에서 처리한 데이터 프레임을 CSV 파일로 반출하는 것을 목표로 한다.
2. 도구
- Google Colaboratory
[Python] 표준정규분포(정규분포) 데이터 생성 (tistory.com)
[Python] 표준정규분포(정규분포) 데이터 생성
1. 목표 - 표준 정규분포 데이터를 생성한다. - 향후 이 데이터로 테스트 셋을 설정하여 통계학적 접근을 이끌어 낸다. 2. 도구 - Google Colaboratory 3. 코드 ''' 정규분포 데이터 (테스트 셋) 생성하기 ''
iotcyuty.tistory.com
3. 설명
- 위 포스팅에서 생성된 정규분포 데이터 (np.random.randn(n) 을 이용) 를 파일로 저장한다.
- 포스팅의 코드를 실행할 때 마다 random 한 샘플 데이터가 생성되는데 이에 대한 결과를 파일로 저장하면 고정된 데이터 값이 저장된다.
4-1. 코드 (CSV 파일 저장하기)
'''
정규분포 데이터 (테스트 셋) 생성하기
'''
import numpy as np # 넘파이 임포트
import matplotlib.pyplot as plt # 맷플롯립.파이플롯 임포트
import pandas as pd # 판다스 임포트
##### 입력 변수 선언 ######
mean_a, std_a = 50.0, 4 # 그룹 a 의 평균, 표준편차 입력
mean_b, std_b = 42.5, 3.2 # 그룹 b 의 평균, 표준편차 입력
##### 표준정규분포데이터 랜덤 생성 ######
s_nordist_a = np.random.randn(2000) # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
s_nordist_b = np.random.randn(2000) # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
##### 정규분포데이터 로 변환 ######
### 정규분포 = 표준편차 * 표준정규분포 + 평균값
nordist_a = std_a * s_nordist_a + mean_a # 평균, 표준편차가 고려된 정규분포데이터로 변환
nordist_b= std_b * s_nordist_b + mean_b # 평균, 표준편차가 고려된 정규분포데이터로 변환
##### 데이터 히스트로그램 그리기 ######
plt.hist(nordist_a)
plt.title("Normal Distribution of group a")
plt.show()
plt.hist(nordist_b)
plt.title("Normal Distribution of group b")
plt.show()
df = pd.DataFrame({"A":nordist_a, "B":nordist_b}) # 판다스 데이터프레임 형태로 타입 변환
##### 기타 정보 확인 ######
print(type(nordist_a)) ## 데이터 타입 확인
df.head(20) ## 상위데이터 20개 출력 확인
##### 데이터 프레임을 파일로 저장 ######
df.to_csv('/content/Sample_normaldistribution.csv',index=False)
df2 = pd.read_csv('/content/Sample_normaldistribution.csv')
df2.head(10)
- 위 코드의 대부분은 위 포스팅 링크의 내용과 동일하고 아래 내용이 추가되었다.
##### 데이터 프레임을 파일로 저장 ######
df.to_csv('/content/Sample_normaldistribution.csv',index=False)
df2 = pd.read_csv('/content/Sample_normaldistribution.csv')
df2.head(10)
- 파일이 생성되었는지 확인하기 위해 google drive 에 접근하여 확인해 본다.
- CSV 파일이 정상적으로 생성이 된 것을 확인하였다. (파일을 다운로드하여 엑셀로 열어 확인)