Statistics
-
최선의 데이터 분석법 : RCT(Random Controlled Trial)Statistics 2018. 12. 14. 15:58
Summary 인과관계를 밝히는 가장 좋은 방법은 RCT다. 개입집단과 비교집단을 나누는 것이 중요하다. RCT의 원칙인과관계를 밝히기 위해 적절하게 집단을 만든다. 반드시 비교집단을 만들어야 한다.집단은 반드시 무작위로 나눈다.각 집단에 충분한 표본수를 배정한다. RCT의 강점인과관계를 과학적으로 보여준다.분석 기법과 결과가 투명하다. RCT의 약점비용, 시간, 노력이 많이 든다.각 기관의 협력도 필요하다. [출처] 데이터 분석의 힘, 이토 고이치로 지음, 전선영 옮김, 인플루엔셜, p99
-
RCT(Random Controlled Trail)의 원칙Statistics 2018. 12. 14. 15:54
RCT(Random Controlled Trail)의 원칙 원칙1 : 적절하게 집단을 나눈다. 원칙2 : 집단은 반드시 무작위로 나눈다. 원칙3 : 집단별 충분한 표본수를 채운다. 모집단을 잘 대표하는 표본의 표본수가 클수록 우발적인 이유(오차)에 의해 평균값이 크게 변화할 가능성이 줄어든다.반대로 표본수가 적으면 우발적인 이유로 평균값이 크게 바뀌어 버린다.표본수가 클수록 평균값 계산에 표준오차가 작아지고 평균값의 신뢰성이 커진다. [출처] 데이터 분석의 힘, 이토 고이치로 지음, 전선영 옮김, 인플루엔셜, p80~85
-
권재명 박사의 카이스트 세미나Statistics 2018. 9. 13. 10:34
Leading AI + Data Science Team Sep 2018 Jamie Kwon(https://dataninja.me)AI > ML > DLwww.matroid.com/scaledml/2017/jeff/pdf 데이터 사이즈가 클수록 정확도는 어떻게 되는가?https://www.cbinsight.com www.hanalyze.com/2018/AI + DS Project Examples Ex1. Top n pageshttps://www.evanmiller.org/how-not-to-sort-by-average-ratin…Wilson Confidence intervalEx2. Running A/B Test https://www.evanmiller.org/sequential-ab-testing.htm..
-
데이터 고속도로Statistics 2018. 8. 31. 16:10
데이터고속도로 구축 등 정부 전폭 지원 약속 판교 스타트업캠퍼스에서 데이터 규제혁신 역설(청와대 페이스북) 2018.8.27/뉴스1 (서울=뉴스1) 홍기삼 기자 = 문재인 대통령은 '데이터 경제시대'를 맞아 데이터고속도로를 구축하는 등 내년 데이터 산업에 1조원을 투자해 데이터산업을 전폭적으로 지원하겠다고 말했다. 개인정보 보호원칙을 지키면서 데이터 산업 규제혁신을 통해 대한민국이 데이터를 가장 잘 다루는 나라로 도약해 데이터 산업을 발전시켜야한다고 역설했다. 문 대통령은 31일 오후 경기 성남 판교 스타트업캠퍼스에서 '데이터를 가장 안전하게 잘 쓰는 나라를 만들겠습니다'라는 슬로건으로 진행된 데이터 규제혁신 행사에 참석해 이같이 밝혔다. 문 대통령은 행사 모두발언을 통해 "이제 대한민국은 인터넷을 가장..
-
Random ForestStatistics/RandomForest 2018. 5. 9. 09:43
안녕하세요 데이터 과학자를 꿈꾸는 꿈쟁이입니다. 현재 MySAS홍보대사를 수행하며 제 블로그와 MySAS E-miner활용하기 게시판에 아래와 같은 글을 동시 연재 중입니다. MySAS 게시판의 연재속도가 더 빠르니 더 많은 정보를 원하신다면 아래 링크를 이용해 주시기 바랍니다. 나만의 SAS메뉴얼- MYSASwww.mysas.co.kr INTRODUCTION 랜덤포레스트는 2001년에 Leo Breiman에 의해 처음으로 소개된 기법으로 의사결정 트리의 단점을 개선하기위한 알고리즘 중 가장 지배적인 알고리즘의, 하나로 다수의 의사결정 나무를 결합하여 하나의 모형을 생성하는 방법 중 하나입니다. 기존의 앙상블 모형과의 가장 큰 차이는 임의성(randomness)를 관측치(observation, insta..