본문 바로가기

주식 투자/투자 용어

구글파이낸스로 코스피, 삼성전자, 엔비디아의 상관계수 계산

728x90
반응형

안녕하세요, 맥스웰입니다.

 

오늘은 통계용어인 상관계수에 대해 알아보려 합니다. 

단순하게, 상관계수두 항목의 과거 데이터를 가지고 연관성을 도출한 확률입니다.

 


상관계수 (correlation coefficient)

 

 

사전적으로 '두 변인 X, Y 사이 상관 관계의 정도를 나타낸 수치' 라는 뜻의 상관계수는 통계학적으로도 많이 사용하고 데이터 분석에서도 많이 쓰는 개념입니다.

 

피어슨 상관계수 계산
피어슨 상관계수 계산

 

우리가 삼성전자 주가와 코스피 지수의 상관계수를 구할 피어슨 상관계수의 공식입니다. 피어슨 상관계수는 두 변인 X와 Y의 선형 상관관계를 계량화한 수치이며, 두 변인의 공분산을 각 변인의 표준편차의 곱으로 나눈 값입니다.

 

이 식을 기억할 필요도, 계산할 필요도 없습니다.

여기서 핵심은 X가 오르면 Y가 반드시 오른다는 상관계수가 1이고 X가 오르면 반드시 Y는 떨어진다면 -1이라는 것만 기억해주시면 됩니다. 1과 -1에 가까울수록 상관관계가 있는 영역들입니다.


투자를 공부하는데 이것이 왜 중요할까요?
자산배분을 A와 B에 50 대 50으로 하며, 이때 A와 B의 상관 계수는 1이라고 가정합니다. 
이 경우, 자산배분의 의미가 없어집니다. 오르면 같이 오르고 떨어지면 같이 떨어지기에 배분한 의미가 사라지는 것입니다.

자산군 관계에 따른 예측 뿐 아니라, 이처럼 자산배분 관점에서 전략을 결정할 때 상관계수는 매우 중요한 역할을 하게됩니다.

 

728x90

구글파이낸스로 상관계수 계산

 

 

0. 구글파이낸스를 활용하기 전에 엑셀에도 상관계수 함수가 있다는 것을 먼저 말씀드립니다. 

엑셀의 상관계수 함수는 CORREL() 이며 구글 스프레드시트에서 활용할 때와 같습니다.

Excel 상관계수 함수
Excel 상관계수 함수

 

반응형

1. 구글 스프레드시트에 접속합니다.

구글 스프레드시트
구글 스프레드시트

 

 

 

2. 구글파이낸스 함수로 원하는 증시 데이터를 뽑는데 활용할 수 있습니다. (종목코드, 가격 등의 속성, 시작일, 종료일, 간격(일/주))로 작성할 수 있습니다.

구글 파이낸스 함수
구글 파이낸스 함수

 

2-1. 삼성전자 코드는 005930, 코스피는 kospi, 엔디비아의 티커는 NVDA입니다. 아래와 같이 구글 파이낸스에서 쉽게 찾을 수 있습니다.

 

구글 파이낸스 티커
구글 파이낸스 티커

 

 

2-2. 티커를 알아냈으면 아래와 같이 구글 파이낸스 함수를 이용해 데이터를 뽑아냅니다.

구글파이낸스 함수
구글파이낸스 함수

 

 

3. 이제 각 종목의 등락률을 구합니다. (지금 값/이전 값) -1 을 입력해 등락률을 계산해줍니다.

종목 등락률
종목 등락률

 

각 종목의 등락률까지 계산하면 아래와 같이 3주 정도의 데이터가 나옵니다. 

상관계수 계산
상관계수 계산 (Raw Data)

 

 

 

4. 마지막으로 엑셀과 같이 CORREL() 함수를 이용해서 각 종목별 상관계수를 계산해줍니다.

 

상관계수 계산
상관계수 계산

 

약 3주정도의 데이터로 코스피와 삼성전자는 높은 양의 상관관계 0.789를 보이고 있으며, 삼성전자와 엔비디아는 미약한 음의 상관관계를 가지고 있다고 볼 수 있습니다. 당연히 데이터 모수가 많이 부족하기 때문에 신뢰성이 높은 데이터는 아닙니다.

 

다만 투자와 자산배분에 참고가 될 수 있으며, 리스크 테이킹의 조사 수단으로 활용할 수 있기 때문에 개념을 익혀두면 좋을 것 같습니다.

 

728x90
반응형