Python

[Python] 데이터 프레임 CSV 파일로 저장하기

Any Developer 2023. 5. 9. 13:05

1. 목표

 - 파이썬에서 처리한 데이터 프레임을 CSV 파일로 반출하는 것을 목표로 한다.

 

2. 도구

 - Google Colaboratory

[Python] 표준정규분포(정규분포) 데이터 생성 (tistory.com)

 

[Python] 표준정규분포(정규분포) 데이터 생성

1. 목표 - 표준 정규분포 데이터를 생성한다. - 향후 이 데이터로 테스트 셋을 설정하여 통계학적 접근을 이끌어 낸다. 2. 도구 - Google Colaboratory 3. 코드 ''' 정규분포 데이터 (테스트 셋) 생성하기 ''

iotcyuty.tistory.com

 

3. 설명

 - 위 포스팅에서 생성된 정규분포 데이터 (np.random.randn(n) 을 이용) 를 파일로 저장한다.

 - 포스팅의 코드를 실행할 때 마다 random 한 샘플 데이터가 생성되는데 이에 대한 결과를 파일로 저장하면 고정된 데이터 값이 저장된다.

 

4-1. 코드 (CSV 파일 저장하기)

'''
정규분포 데이터 (테스트 셋) 생성하기
'''

import numpy as np  # 넘파이 임포트
import matplotlib.pyplot as plt  # 맷플롯립.파이플롯 임포트
import pandas as pd  # 판다스 임포트


##### 입력 변수 선언 ######
mean_a, std_a = 50.0, 4  # 그룹 a 의 평균, 표준편차 입력
mean_b, std_b = 42.5, 3.2  # 그룹 b 의 평균, 표준편차 입력

##### 표준정규분포데이터 랜덤 생성 ######
s_nordist_a = np.random.randn(2000)  # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성
s_nordist_b = np.random.randn(2000)  # 평균 0 , 표준편차 1 인 표준정규분포데이터 랜덤 생성

##### 정규분포데이터 로 변환 ######
### 정규분포 = 표준편차 * 표준정규분포 + 평균값
nordist_a = std_a * s_nordist_a + mean_a   # 평균, 표준편차가 고려된 정규분포데이터로 변환
nordist_b= std_b * s_nordist_b + mean_b   # 평균, 표준편차가 고려된 정규분포데이터로 변환

##### 데이터 히스트로그램 그리기 ######
plt.hist(nordist_a)
plt.title("Normal Distribution of group a")
plt.show()

plt.hist(nordist_b)
plt.title("Normal Distribution of group b")
plt.show()

df = pd.DataFrame({"A":nordist_a, "B":nordist_b})  # 판다스 데이터프레임 형태로 타입 변환

##### 기타 정보 확인 ######
print(type(nordist_a))  ## 데이터 타입 확인
df.head(20)  ## 상위데이터 20개 출력 확인

##### 데이터 프레임을 파일로 저장 ######
df.to_csv('/content/Sample_normaldistribution.csv',index=False)
df2 = pd.read_csv('/content/Sample_normaldistribution.csv')

df2.head(10)

- 위 코드의 대부분은 위 포스팅 링크의 내용과 동일하고 아래 내용이 추가되었다.

##### 데이터 프레임을 파일로 저장 ######
df.to_csv('/content/Sample_normaldistribution.csv',index=False)
df2 = pd.read_csv('/content/Sample_normaldistribution.csv')

df2.head(10)

- 파일이 생성되었는지 확인하기 위해 google drive 에 접근하여 확인해 본다.

 

 

  -  CSV 파일이 정상적으로 생성이 된 것을 확인하였다. (파일을 다운로드하여 엑셀로 열어 확인)