1. 목표
- 데이터프레임의 지정 열 (Column) 값을 히스트그램 그래프를 그려본다.
2. 도구
- Google Colaboratory
3. 사전 정보 확인
[파이썬] 외부 데이터 (Gibhub) 불러오기와 정보 확인하기 (tistory.com)
[파이썬] 외부 데이터 (Gibhub) 불러오기와 정보 확인하기
1. 개요 및 목표 - 판다스 패키지에서 제공하는 read_csv 메소드를 이용해서 외부 데이터를 불러오기. - 불러온 외부 데이터 (데이터 프레임 형태) 의 컬럼 정보, 데이터타입, 결측치 정보, 기초 통계
iotcyuty.tistory.com
4. 코드 작성
import pandas as pd
import matplotlib.pyplot as plt # 맷플롯립 패키지 임포트
df = pd.read_csv("https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv") # 타이타익 데이터 읽기 || 판다스 데이터프레임
fare_data = df["Fare"] # Fare 데이터만 추출함 - 연속형 데이터
pclass_data = df["Pclass"] # Pclass 데이터만 추출함 - 연속형 데이터 [1,2,3]
sex_data = df["Sex"] # Sex 데이터만 추출함 - 범주형 데이터
plt.hist(fare_data) # Fare 데이터 히스토그램 플롯
plt.show()
plt.hist(pclass_data) # Pclass 데이터 히스토그램 플롯
plt.show()
plt.hist(sex_data) # Sex 데이터 히스토그램 플롯
plt.show()
5. 해석
- import matplotlib.pyplot as plt 를 통해 맷플롯립 패키지를 임포트한다.
- 타이타닉 데이터 (Github) 에 데이터를 불러온다.
- plt.hist(X) 과 plt.show() 실행을 통해 히스토그램 그래프를 그려서 확인할 수 있다.
6. 참고
hist(x) — Matplotlib 3.7.1 documentation
hist(x) — Matplotlib 3.7.1 documentation
Note Click here to download the full example code hist(x) See hist. import matplotlib.pyplot as plt import numpy as np plt.style.use('_mpl-gallery') # make data np.random.seed(1) x = 4 + np.random.normal(0, 1.5, 200) # plot: fig, ax = plt.subplots() ax.his
matplotlib.org
'Python' 카테고리의 다른 글
[Python] 표준정규분포(정규분포) 데이터 생성 (0) | 2023.05.09 |
---|---|
[Python] Seaborn 패키지 (0) | 2023.05.08 |
[Python] Matplotlib.pyplot 상자수염 그래프 그리기 (0) | 2023.05.08 |
[파이썬] 데이터프레임 - 범주형 데이터 빈도수 구하기 (0) | 2023.05.04 |
[파이썬] 외부 데이터 (Gibhub) 불러오기와 정보 확인하기 (0) | 2023.05.04 |