본문 바로가기
CODING/Python

[데이터/Python] # 1 데이터 저널리즘이란

by 밍톨맹톨 2020. 7. 31.
728x90
728x90

데이터 저널리즘이란?

-창조물을 뒷받침하기 위해 데이터를 수집, 갈무리, 조직, 분석, 시각화, 출간하는 행위

-데이터 분석을 통해 새로운 사실을 찾아내어 보도하는 것

-거대 데이터를 수집하여 분석하고, 현상과 사건을 좀 더 심층적이고 과학적으로 분석하는 것 

 

dino12.csv
0.05MB

주어진 csv 파일을 가지고 저 그림을 그려볼 것인데 B = {(비표준화 계수가 들어갈 자리)} 지만 비표준화 계수를 어떻게 구하는지 아무리 검색해봐도 이해를 못해서 일단 빼놓자 

 

[ Import 라이브러리 ]

import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['figure.figsize'] = [12, 8]

rcParams 설정을 활용하면, 하트의 크기와 선의 색, 크기 등 [ 기본 값 ]을 설정할 수 있음

 

dino_data = pd.read_csv('dino12.csv',index_col = 0)

index_col - 숫자의 값에 있는 column을 index로 사용하겠다는 것

plt.figure()

plt.plot('dino_X',  # x
         'dino_Y',  # y
         data=dino_data, 
         linestyle='none', 
         marker='d', 
         markersize= 10,
         color='green', 
         alpha= 0.7 )

plt.ylabel('Y(M = {:.2f} SD = {:.2f})'.format(np.mean(dino_data['dino_Y']),np.std(dino_data['dino_Y'])),fontsize = 20)
plt.xlabel('X(M = {:.2f} SD = {:.2f})'.format(np.mean(dino_data['dino_X']),np.std(dino_data['dino_X'])),fontsize = 20)
plt.title('Datasaurus (B = {})',fontsize = 20)
plt.show()
linestyle을 'none' 으로 설정하지 않았을 때
linestyle을 'none'으로 설정했을 때

[ color에 넣을 수 있는 것]

문자
b 파란색
g 초록색
r 빨간색
c 청록색
m 자주색
y 노란색
k 흑색
w 백색

maker에 넣을 수 있는 아이들도 많긴 한데 필요할 때마다 찾아 써야겠다! ( 너무 많아서 귀찮,,, 아 ㅎ,, )

alpha - 색의 투명도를 조절

 

plt.xlabel - x축

plt.ylabel - y축

plt.title - 큰 타이틀

 

[ 다음 게시물 ] 

같은 파일에 있는 데이터를 가지고 산점도 행렬을 만들어볼 것이다 🔫 탕 

 

728x90

댓글