본문 바로가기

Coding/R

R 활용을 위한 기초 통계학 - 1

통계학







R언어는 기본적으로 통계학을 위한 언어이다. 


따라서 활용하기 위해선 기본적인 통계적 개념은 알아두는 것이 좋다.


이에 통계학에 관한 기본개념을 정리하려고 한다.





통계학이란?




정의 


      과학적인 이론과 실증적인 연구방법으로,

      현상에 대한 분석과 미래에 대한 합리적인 의사결정을 내리는 것.



순서 


      1. 자료수집    2. 모집단 모수의 추출    3. 타당성있는 의사결정



기본용어 


      자료(data) - 기본적인 사실들의 집합.

      정보(information) - 자료를 의미있는 형태로 변환시킨 것.

      모집단(population) - 연구대상이 되는 집단 ex) 롤하는 사람들

      표본(sample) - 연구대상이 된 모집단의 일부 ex) 롤하는 사람들 중 일부



방법론


      기술통계학 - 적절한 방법으로 요약하고 특성을 기술하는 것.

      추리통계학 - 모집단으로부터 얻은 표본을 이용하여 모집단의 특성을 추론.





연구조사





문제 인식 - 롤 하는 사람이 줄어들었다.



연구질문 - 어떻게 롤 유저를 증가시키는가?



조사질문 - 요인으로 나누어 나타낸다.


               1). 온라인상 평가는 좋은가?

               2). 서비스에서 부족한 점은 없는가?

               3). 게임의 라이프사이클은 어느상태인가?



측정질문 - 조사질문에서 제기되는 요인에 대한 구체적인 변수들 발견,

                  응답자로부터 실질적인 답을 구 할 수 있어야 한다.

 

               1). 롤의 재미는? (1: 나쁘다 , 2: 중간이다, 3: 좋다)

               2). 상담원의 답변 상태는? (1: 나쁘다 , 2: 중간이다, 3: 좋다)      

               3). 라이프사이클은 성숙기로 판단.



용어정리 


        측정(measurement) - 관찰대상에 수치를 부여

        척도(scale) - 일정한 규칙으로 질적인 자료를 양적인 자료로 전환

             1)명목척도(nominal scale) - 숫자를 사용

             2)서열척도(ordinal scale) - 속성에 따라 순위 결정

             3)등간철도(interval scale) - 현재 당신의 기분 상태는 1~5점 = 리커트척도

             4)비율척도(ratio sclae) - 비율개념 추가


       변수(variable) - 요인을 나타내는 속성.

             양적변수(quantitative variable) - 수치로 나타낼 수 있는 것. (ex - 딜량, 피해량)

                       1)이산변수(discrete variable) - 정수값만 갖는 것.

                       2)연속변수(continuous variable) - 어떠한 값도 가지는 것.

             질적변수(qualitative variable) - 범주로 표시 (ex - 탑,미드,정글러)


       자료(data)

             질적자료(qualitative data) - 질적변수로 나타낸 자료.

             양적자료(quantitative data) - 양적변수로 나타낸 자료


             시계열자료(time-series data) - 시간 순서에 따라 변수 측정.

             횡단적자료(cross-sectional data) - 둘 이상의 특성을 동시 측정.



'Coding > R' 카테고리의 다른 글

GA데이터 R로 분석하기  (0) 2020.09.11