728x90
728x90
데이터 저널리즘이란?
-창조물을 뒷받침하기 위해 데이터를 수집, 갈무리, 조직, 분석, 시각화, 출간하는 행위
-데이터 분석을 통해 새로운 사실을 찾아내어 보도하는 것
-거대 데이터를 수집하여 분석하고, 현상과 사건을 좀 더 심층적이고 과학적으로 분석하는 것
주어진 csv 파일을 가지고 저 그림을 그려볼 것인데 B = {(비표준화 계수가 들어갈 자리)} 지만 비표준화 계수를 어떻게 구하는지 아무리 검색해봐도 이해를 못해서 일단 빼놓자
[ Import 라이브러리 ]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['figure.figsize'] = [12, 8]
rcParams 설정을 활용하면, 하트의 크기와 선의 색, 크기 등 [ 기본 값 ]을 설정할 수 있음
dino_data = pd.read_csv('dino12.csv',index_col = 0)
index_col - 숫자의 값에 있는 column을 index로 사용하겠다는 것
plt.figure()
plt.plot('dino_X', # x
'dino_Y', # y
data=dino_data,
linestyle='none',
marker='d',
markersize= 10,
color='green',
alpha= 0.7 )
plt.ylabel('Y(M = {:.2f} SD = {:.2f})'.format(np.mean(dino_data['dino_Y']),np.std(dino_data['dino_Y'])),fontsize = 20)
plt.xlabel('X(M = {:.2f} SD = {:.2f})'.format(np.mean(dino_data['dino_X']),np.std(dino_data['dino_X'])),fontsize = 20)
plt.title('Datasaurus (B = {})',fontsize = 20)
plt.show()
[ color에 넣을 수 있는 것]
문자 | 색 |
b | 파란색 |
g | 초록색 |
r | 빨간색 |
c | 청록색 |
m | 자주색 |
y | 노란색 |
k | 흑색 |
w | 백색 |
maker에 넣을 수 있는 아이들도 많긴 한데 필요할 때마다 찾아 써야겠다! ( 너무 많아서 귀찮,,, 아 ㅎ,, )
alpha - 색의 투명도를 조절
plt.xlabel - x축
plt.ylabel - y축
plt.title - 큰 타이틀
[ 다음 게시물 ] 은
같은 파일에 있는 데이터를 가지고 산점도 행렬을 만들어볼 것이다 🔫 탕
728x90
'CODING > Python' 카테고리의 다른 글
[Python/Flask] flask-restx를 이용한 CRUD구현 (1) : 가상환경 설치하기 (0) | 2021.11.23 |
---|---|
[Python] - 딕셔너리 key, value 서로 위치 바꾸는 법 (0) | 2021.11.05 |
[Python/Django] Mac 장고 venv로 가상환경 생성 (0) | 2021.08.08 |
[데이터/Python] # 3 비표준화계수란 (2) | 2020.08.08 |
[데이터/Python] # 2 산점도 행렬 (0) | 2020.08.01 |
댓글