전체 글
-
이차원 밀집도 그리기Python 2018. 11. 16. 11:07
import numpy as npimport pandas as pd import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline # seaborn 라이브러리에내장된 데이터 불러오기 tips = sns.load_dataset("tips") # 이차원 밀집도 그리기 : 음영 효과를 넣음 ax = plt.subplot() ax = sns.kdeplot(data = tips.total_bill, data2 = tips.tip, shade = True)ax.set_title("Kernel Density Plot of Total Bill and Tip") ax.set_xlabel("Total Bill") ax.set_ylabel("Tip") # ..
-
신영준 박사의 Change Ground #02 : 노력이 재능을 이길 수 있을까?Books 2018. 11. 15. 23:05
신영준 박사의 Change Ground #02 : Q. 노력이 재능을 이길 수 있을까? 올림픽 선수들의 기록이 좋아지는 것은 훈련 방법이 점진적으로 좋아져서 좋은 성적을 거두는 것이다.무조건적인 노력으로는 어림도 없다.잘못된 방법으로 열심히 노력하니까 안되는 것이다.방법에 대한 피드백이 필요하다.일기를 써서라도 셀프 피드백을 해야 한다.가장 중요한 피드백은 자기반성이다.자기 반성은 머리로만 하면 안된다. 생각은 휘발성이 강해서 금방 사라진다.기록을 해야 한다. 기록은 기억을 이긴다.
-
데이터 시각화가 필요한 이유 : Ansombe's QuarterPython 2018. 11. 15. 16:12
import matplotlib.pyplot as pltimport numpy as np import pandas as pd import seaborn as sns %matplotlib inline # 데이터 불러오기 anscombe = sns.load_dataset("anscombe") # 데이터 분할하기 d1 = anscombe.loc[anscombe.dataset == "I", ] d2 = anscombe.loc[anscombe.dataset == "II", ] d3 = anscombe.loc[anscombe.dataset == "III", ] d4 = anscombe.loc[anscombe.dataset == "IV", ] # 그래프의 기본 틀 만들기fig = plt.figure() # 그래프의 ..
-
-
찹쌀떡글쓰기 2018. 11. 11. 07:42
15층의 어느 방. 어둠이 짙어간다. 작은 빗방울을 머금다. 적막하다.그때 소리가 밤하늘을 뚫는다. 찹쌀~~~~~떡! 찹쌀~~~~~떡!고층 건물로 둘러쌓인 광화문 어느 지역. 그곳에 어울리지 않을 것 같은 소리가 메아리친다. 호텔의 뷔페들, 고층건물 앞에 즐비하게 늘어선 맛집들, 그리고 카페들.이런 것들과 경쟁되지 않을 것 같은 찹쌀떡을 들고 다니면서 외치는 어느 남자의 소리. 화려해 보이고 풍족해 보이는 도시의 밤하늘에 너무도 선명하게 울려 퍼진다.그 사람은 알았을까? 화려함 속에 가려진 초라함. 풍족함 속에 가려진 궁핍함. 도시 속에 숨겨진 본향에 대한 향수.아무도 듣지 않고, 반응할 것 같지 않은, 광야인 듯 광야 아닌 광야 같은 도시를 깨우고 있다.마치 광야에서 세례 요한이 예수님의 오실 길을 준..
-
수학적 주석 넣기(Mathematical Annotation in R)R 2018. 11. 7. 12:58
Mathematical Annotation in RR Core Team (R-core@R-project.org ) The R Project for Statistical Computing.Lijia Yu (yu@lijiayu.net / GitHub / Twitter) A master candidate majoring in Bioinformatics at Beijing Institute of Genomics.Karl Broman (kbroman@biostat.wisc.edu / GitHub / Twitter) Department of Biostatistics and Medical Informatics, University of Wisconsin-Madison; research in statistical ge..
-
결측값(Missing Value) 처리하기R 2018. 11. 7. 10:10
데이터 과학결측데이터1 미국대선 여론조사 1 2제45대 미국 대통령을 선출하는 선거에서 많은 언론에서 예측한 바와 다르게 공화당 도널드 트럼프 후보가 민주당 힐러리 클린턴 후보를 누르고 당선되었다. 이를 두고 트럼프 후보 당선을 정확히 예측한 인공지능(AI) 사례를 들며 기존 예측기법에 대한 문제점 제기 및 새로운 시대의 도래를 언급하고 있다. 이에 앞서 지금과 동일한 상황이 미국에서 여러번 있어와서 새삼스러운 것은 아니다.1916년 대선: 우편 설문조사를 바탕으로 민주당 우드로 윌슨 후보 당선 예측한리터리리 다이제스트는 1936년 대통령 예측에서 실패1천만명 유권자를 대상으로 설문조사를 실시했으나 표본의 대표성에 문제가 있음주소 확보가 용이한 구독자, 자동차 등록부, 전화번호부 등 공화당 성향 유권자에..