728x90
300x250

[통계(Statistics)] 베타의 계산 (평균,분산,표준편차,공분산,상관계수,베타계수)

 

지금 소개할 것은 통계처리라고 흔히 표현할 수 있다.

정밀한 통계는 지금 식으로는 매우 엄밀하고 정말한 측정을 수행할 수 없다.

 

그러나 지표를 살펴보는데 많은 도움이 될 것으로 보인다.

많은 곳에서 통계를 사용하고 있다.

 

 


1. 식 - 소개

 

식을 다음과 같이 정리할 수 있다.

 

배열

val

val[0]

1

val[1]

2

val[2]

3

...

...

val[n]

n

 

1-1. 평균(Average)

 

평균은 각 결과 val를 더해서 n으로 나눈 값을 말한다.

 

 

(average = 평균, 에버레이지)

 

1-2. 분산(Variance)

분산(Variance)은 각 사건의 결과()와 기대치()와의 차이(편차)를 제곱한 값의 기대치이다.

 

 

 

(variance = 분산, 베리언스)

 

1-3. 표준 편차(Standard Deviation)

 

표준편차(standard deviation)는 분산의 제곱근()이다.

 

 

1-4. 공분산(covariance)

 

공분산은 아래의 식으로 구할 수 있다.

공분산과 상관계수는 보완관계가 있는 수식이다.

 

 

 

 

: i = 1, 2, ..., n

(A): 각 사건의 결과()

(A): 기대치

 

1-5. 상관계수(correlation coefficient)
상관계수는 공분산을 각각의 표준편차로 나누어 표준화한 것이다. 따라서 상관계수는 공분산과 같은 부호를 가지며 의 값을 갖게 된다.

 

상관계수

설명

 

 같은 방향(양의 상관관계)

 

 체계적인 관계가 없음

 

 반대 방향(음의 상관관계)

 

1-6. 베타계수

 

시장포트폴리오를 분석할 때 사용하는 식이 있음.

크게 어려운 식은 아니다. 추정식이라고 불리는 식이 있다.

 

완벽한 식은 아니고, CAPM을 표시할 때 사용되는 식이라고 보는 게 좋겠다.

 

 

이 식을 풀면, 그래프가 나온다.

그래프로 찍어봐야 좋은 데이터를 볼 수 있는 ??? 이상한 식이 있다.

 

베타의 기울기는 개별 데이터 i의 민감도를 나타낸다.

 

 

구분

내용

 

시장포트폴리오

시장과 수익률의 진폭이 같은 주식

 

방어적인 주식

시장보다 수익률의 진폭이 작은 주식

공격적인 주식

시장보다 수익률의 진폭이 큰 주식

무위험자산

시장의 움직임과 상관없이 일정한 수익률이 보장되는 자산

 

스프레드시트나 컴퓨터 프로그래밍 등으로 해결해보기 바란다.

CAPM(자본자산가격결정모형)에 관한 식을 y축으로, 베타계수 b를 x축으로 두었을 때 이자율을 해석할 때가 수작업이 요구될 수 있다.

 

CAPM에 관한 식은 다음과 같이 구성된다.

 

 

: 개별자산 i의 기대수익률

: 시장포트폴리오 기대수익률

: 무위험이자율

: 개별자산 i의 수익률과 시장포트폴리오 수익률과의 공분산

: 시장포트폴리오 수익률의 분산(위험)

 

y축[CAPM] 

 

원점(0, 0)

 X축[베타]

 


2. 스프레드시트 - 함수

계산하고자 하는 값

함수 식

평균

 average(number1, number2, ..)

분산(표본)

 var(number1, number2, ...)

표준편차(표본)

stdev(number1, number2, ...)

공분산(모집단)

covar(array1, array2)

상관계수

 correl(array1, array2)

베타계수(회귀식의 기울기

slop(known_y's, known_x's)

 

 

반응형
728x90
300x250

[통계(Statistics)] 1. 통계(Statistics), 통계청 사이트를 통한 자료 찾아보기

 

오늘날 고용 위기, 경제 등의 다양한 문제들이 현존해있다.

오늘날의 정보를 알고, 미래를 예측한다면 미래를 대비한 올바른 의사결정이 될 수 있다.

 

적을 알고 나를 알면, 지피지기면 백전백승이라고 했다.

 

현재를 알고 내일을 알기 위해서 통계 자료는 무척 중요하다고 할 수 있다.

더 나아가 미래를 올바른 시야로 바라볼 수 있는 좋은 지표가 된다.

 

올바른 데이터를 찾기 위해서는 자료를 잘 찾고 분석하고 해석할 수 있어야 한다.

 


1. 통계에 대해서

 

사회 과학에 대해서 공부를 좀 더 하거나 혹은 심심해서 혹은 과제를 하기 위해서 등 여러가지의 일을 수행하기 위해서 통계청 사이트를 접속한다.

지표의 데이터를 해석하기 위해서 간단한 스프레드시트를 사용할 수 있다면 좋은 정보를 탐색할 수가 있다.

 

물론 고급적인 이상적 벡터(Ideal Vector)를 도출하기 위해서는 좀 더 복잡한 수식 등이 요구될 수도 있다.

대체로 상용 소프트웨어를 사용하여 분석하는 경우 등도 있을 수 있고, 고급 수식을 공부하여 고급 수식에 맞는 프로그래밍화된 통계를 얻어낼 수도 있다.

 

흔히 수학에서는 "확률과 통계" 등의 표현으로 있는 경우가 있다.

다만, 확률과 통계는 순수한 수학이 아니다.

 

확률과 통계를 하기 위한 기능이 가깝다고 하는 것이 더 적절하다.

아무튼 어려운 수학적인 이야기를 최대한 제외하고 가볍게 통계 데이터를 찾아가는 방법에 대해서 소개하겠다.

 


 

2. 통계청 - 자료 검색하기

 

한국(이하 대한민국, Republic of Korea)에서는 거의 모든 데이터 등의 취합을 통계청에서 통합적으로 관장하고 있다.

기관 등의 데이터 등도 살펴볼 수 있다.

 

나는 글에서 "빅데이터"라는 단어는 사용하지 않을 것이다.

 

아래의 사이트는 통계청 사이트이다.

 

 

그림 1-1. 통계청 웹 사이트

 

통계청 웹 사이트에 접속하면, 지표 등부터 국내통계, 국제통계 등 많은 데이터가 존재한다.

아래의 그림은 "국내 통계"를 클릭한 모습이다.

 

그림 1-2. 국내통계 / 주제별 통계, 통계청

 

크게 어렵지 않게 화면이 구성되어 있다.

몇 가지 세부항목 등을 클릭하면 자료를 열람하거나 추출할 수가 있다.

 


2. 예) 성 및 연령별 추계 보기

 

한번 인구 동향을 통계청 데이터로 살펴보도록 하겠다.

인구가구를 클릭하면, "장래인구추계"가 있다.
"전국(2016)"을 클릭하면 세부항목이 나온다.

"성 및 연령별 추계인구(1세별, 5세별) / 전국"을 클릭한다.

 

 

그림 2-1. 통계청 - 자료찾기, 도도(Dodo)

 

아래의 그림처럼 데이터를 살펴볼 수 있다.

 

 

그림 2-2. 통계청 - 데이터 보기, 도도(Dodo)

 

 

그림 2-3. 통계청 - 추계 정보

 

다음은 통계자료를 내려받는 방법에 대해서 소개한다.

검은색으로 동그라미 친 아래의 그림을 클릭하면, 통계자료를 내려받을 수 있다.

 

 

그림 2-4. 통계청 - 자료 내려받기, 도도(Dodo)

 

파이썬과 같은 도구를 사용해서 분석을 하는 사람들이면, CSV 파일을 내려받는 것도 좋다.

Excel 파일로 내려받을 수도 있다.

 

 

그림 2-5. 통계청 - 자료 다운로드 받기, 도도(Dodo)

 


 

3. 자료 열어보기

 

통계청 자료를 내려받았다. 파일을 열어보면, 아래처럼 뜬다.

 

 

그림 3-1. 통계청 - 자료 열기, 도도(Dodo)

 


4. 차트 만들어보기

 

데이터가 매우 많다. 일반 범용적인 스프레드시트로는 데이터를 차트화하는데는 한계가 있다.

일반 범용적인 스프레드시트로 데이터를 차트로 만드는 것에 대해서 소개하겠다.

 

(참고) 일반적인 차트 등의 만드는 기능은 거의 비슷하다.

 

 

그림 4-1. 자료 가공, 도도(Dodo)

 

 

그림 4-2. 자료 가공, 도도(Dodo)

 

데이터 탭에 오른쪽 버튼을 클릭한다.

"이동/복사(M)"을 누른다.

 

 

그림 4-3. 이동/복사, 도도(Dodo)

 

"(끝으로 이동)"을 선택한다.

"복사본 만들기(C)"를 체크한다.

"확인"을 누른다.

 

 

그림 4-4. 탭 이름 바꾸기, 도도(Dodo)

 

그림 4-4에서 데이터 (2)의 탭을 더블클릭한다.

"가공"이라고 입력한다.

탭 이름은 임의로 바꿔도 무방하다.

 

그림 4-5. 계와 가정별만 남겨두기, 도도(Dodo)

 

그림 4-5처럼 가정별과 연도별 추계 데이터만 남겨둔다.

 

 

 

 

그림 4-6. 차트 만들기 누르기 전, 도도(Dodo)

 

그림 4-6은 차트 만들기를 누르기 전에 있는 상태이다.

"가정별", "연령별" 데이터를 블록을 씌운 후 차트를 이처럼 만들 수 있다.

 

 

그림 4-7. 크기 조정, 도도(Dodo)

 

그림 4-7은 크기를 조정하는 모습이다.

적당한 크기로 조정한다.

 

 

그림 4-8. 중위 추계 데이터 - 차트로 살펴보기, 도도(Dodo)

 

그림 4-8처럼 차트로 데이터를 살펴볼 수 있게 되었다.

 

 

[첨부(Attachment)]

makeChart.zip

 


5. 통계 - 분석해보기

 

(1) 베이지 정리(Bayes theorem)는 확률에 가까운 분석이다.

-> 복잡하지만, 컴퓨터 프로그래밍으로 구할 수도 있다.

 

(2) 히스토그램은 도표에 관한 분석이다.

 

 

그림 5-1. 히스토그램, 도도(Dodo)

 

계급이 있어야 하고, 계급에 따른 빈도수를 도출하여 빈도수를 분석할 때 사용된다.

 


6. 통계청 데이터에 없는 자료도 있다?

 

통계청 데이터에는 없는 데이터도 있을 수가 있다.

최근에는 국가통계 관련 사이트 등이 몇 곳 있는데 이를 참고하는 것이 더 좋을 수도 있다.

국가통계 데이터를 찾아서 없는 경우에는 불가피하게 설문조사기법 등을 동원하여 조사할 수도 있다.

 

 

그림 6-1. 임금격차 검색 결과, 국가통계포털

 

그림 6-1에 대해서 이해를 돕기 위해서 랜덤 키워드를 선정하였음.
-> 임금격차에 관해서는 경제에 관심이 있는 경우에 찾아보면 좋을 것 같다.
-> 순수한 셈플 데이터를 얻기 위해서 랜덤 키워드로 정했으니 이점 참고하기 바람.
-> 통계청에 기부/후원 등을 받은 적이 없음. 무관함.

 

 

그림 6-2. 비정규직, 정규직 검색 결과, 국가통계포털

 

그림 6-2의 검색 키워드는 랜덤에 의해 선정되었음.
-> 예를 들면, 관심이 있는 주제가 있다면 혹은 다른 좋은 주제가 있다면 검색을 해도 좋음.
-> 통계청에 기부/후원 등을 받은 적이 없음. 무관함.

 


7. 참고자료(Reference)

 

1. 통계청, 장래인구추계, Last Modfied , Accessed by 2018-07-31, http://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1BPA001&conn_path=I3, 통계청

2. 국가통계포털, Last Modfied , Accessed by 2018-07-31, http://kosis.kr/, 통계청

반응형

+ Recent posts