/* 블로그 소개 */

이 블로그는 경제학 관련한 이야기를 담고 있습니다.  제가 연구중에 있는 분야이거나, 관심있는 주제를 다룹니다.  (주요 관심영역 참고)  경우에 따라서는 생소하거나 쉽지 않을 수도 있습니다만, 이를 이유로 제게 불평을 남기지는 말아주시길 부탁드립니다.  이 블로그는 대중적인 목적으로 개설한 것이 아니기 때문입니다.  이 블로그는 경제학에서 이루어지고 있는 흥미로운 연구를 소개하고자 하는 학술적 성격이 강합니다.

글은 세 카테고리로 나뉩니다. 
1. economics: 경제학 이론을 주로 다룹니다.
2. student life: phd 학생으로서의 일상을 담고 있습니다.
3. miscellany: 이도 저도 아닌, 말 그대로 잡다한..


* 2007년 5월 16일 (한국시간으로는 5월 17일) 개설.
* 이글루에서 두 집 살림 중. (winipop.egloos.com 영양가 없는 라면블로그임)
* 주요 관심 영역
- economics: game theory, economics of networks, agent-based computational economics
- statistics: time-series analysis, Bayesian statistics, spatial analysis


※ 몇 가지 규칙들
- 길고 장황한 덧글이라면 트랙백하실 것을 권장합니다.
- 퍼갈땐 출처를 밝히세요.  (전체 및 부분 인용 뿐만 아니라 아이디어만 빌리는 경우에도 출처가 없으면 표절입니다.)
- 상식없는 덧글(욕설, 비방, 딴지걸기, 음해)은 경고없이 삭제합니다.

by 너구리 | 2008/12/31 23:59 | miscellany | 트랙백 | 덧글(10)

/* 한국 경제학계 분위기가 이렇다는데.. */

내가 요즘 관심 한참 많이 갖고 있는 분야가 게임이론의 틀로 보는 이타성과 집단대 개인의 상호작용인데, 작년에 이와 관련해서 사이언스지에 제법 재미있는 논문이 하나 나왔다.  논문 저자가 한국인인데, 마침 여기서 파이낸스 박사과정에 계시는 분이 이 분과 한국에서 같은 학교에 있으면서 개인적으로 조금 안다고 하시기에, 혹시 방학때 한국 가게되면 같이 한 번 뵐까 해서 얘기를 좀 했던 적이 있었다.  이분은 방학이라 지금 한국에 가있고, 나야 뭐.. 학기중보다 더 바쁜 방학을 보내고 있던지라 한국에 못가고 있다.

아침에 잠시 이분과 메신저로 얘기를 하던 차에, 그 교수님 말이 나왔다.  다음 학기부터 K대로 옮기기로 하셨단 얘기, 그러면서 얼마전에 들었다던 그 사이언스지 논문에 얽힌 비하인드 스토리..  원래 그 논문은 맨 처음에 한국경제학회지에 냈었다고 한다.  그런데, 너무 짧고 간단해서 학문적 기여가 없다고 판단, 리젝되었다는거다.  그래서 정말 이 논문이 가치가 그거밖에 안되는거냐, 하는 오기 비슷한 반발심에 Science에 보냈단다.  (예전, 황박사 사건때 문제의 논문도 Science였던 걸로 기억하는데, 아무튼 Science는 자연과학 톱저널이다.)

사실 난 이 얘기 들으면서 말도 안돼, 일개 박사과정 학생인 내가 읽었을 때도 흥미롭고 재미있으면서도 상당한 직관을 담은 논문이라는걸 알았는데, 한국에 경제학 교수님들이 그걸 몰랐을 리가 있나, 하는 반응이었다.  그런데, 몹시 씁쓸한 얘기지만, 그게 한국 경제학의 현주소라고 한다.  엘리트 코스 밟아 톱스쿨에서 나름 굉장히 열심히 공부하신 분들인데, 일단 한국에서 교수로 채용만 되면 그 때부터는 온갖 행정잡무에 시달리고 정치적 활동에 휩쓸려 다니는게 대부분이라, 공부 정말 제대로 꾸준히 하는 분을 찾기 힘들다고..  심지어는 한국 경제학의 거장이라고 하는 모 교수님도 세계 경제학 저널에 등재한 논문 하나 없이 십수년이라고 한다.  여기서는 일개 junior lecturer조차도 매년 한 두편씩 저널에 논문을 내는데 말이다.  아무리 톱스쿨에서 박사받았다 한들 1,2년만 공부를 게을리 하면 그저 학부생보다 조금 나은 수준일 뿐, 경제학의 학문적 발전에 기여는 커녕 현재의 흐름을 따라가는 것조차 쉽지가 않은데, 한국의 대학에서 제대로 된 보직을 받는 순간 공부와는 자연스럽게 멀어질 수밖에 없는 분위기라고 하니, 그야말로 씁쓸하다.  그렇다보니 십수년 교수생활 해오시고 나름 이름좀 있는 분들께서 저널 논문 심사할때 그저 복잡한 수식과 난해한 용어로 가득 채워지면 뭔가 있는 것처럼 여겨서 잘 평가하고, 직관을 담은 논문이라도 단순하면 단지 '없어보인다'는 이유로 리젝시키는거다.  여기서는 늘 듣는 얘기가 좋은 모델의 조건이 "simple & intuitive"임을 생각해보면, 이건 정말 비웃음 나오는 일이다.  심지어 노벨 경제학상 받은 사람들의 논문을 봐도 단순하면서도 직관적이어서 현실에 대한 통찰을 쉽게 모형화하고 있는데도 말이다.

솔직히 말하자면, 난 한국에서 경제학을 공부해본 적이 없기 때문에 경제학계가 어떤지 전혀 모른다.  내가 알고 있는건, 한국에서 유명하다고 하는 경제학자들의 논문을 저널에서 거의 본적이 없다는 것이다.  가끔 한국인 이름이 눈에 들어와서 살펴보면 영미권 대학에서 일하는 한국인인 경우를 빼면, 한국에서 유명하다는 경제학자의 논문을 톱저널에서 본적은 정말 거의 없다.  한국의 경제학자들이 사회 문제에 얼마나 깊숙히 관여하고 있는지에 대해서는 모르겠다.  어떤 사람들은 그게 경제학자가 추구해야할 일이라고도 하던데, 개인적으로는 그게 본질이라고 생각하지 않기에, 잘 모르겠다.  다만, 순수한 학문적인 측면에서, 한국 경제학계는 학문의 변방이라는 생각을 떨쳐버리기 힘들다.  내가 결국 돌아가야할 고향인지라, 더 안타깝지 말이다.

by 너구리 | 2008/08/16 20:34 | miscellany | 트랙백 | 덧글(9)

/* 당분간은.. */

요즘 몹시 바쁩니다.
아직 마무리하지 못한 시계열분석 시리즈의 마지막에 대한 문의에 답을 하자면, 당분간 어렵겠습니다.  변명이라면, 별거 아닌듯한 포스팅이지만, 나름대로 수학적 언어를 말로 바꿔 설명해야 하는 고충도 있고, 수식 입력 역시나 만만찮게 시간이 걸리는지라...  바쁜 일이 정리되고 나면 최대한 빨리 시리즈를 마무리하도록 할께요.

by 너구리 | 2008/08/07 16:55 | 트랙백 | 덧글(2)

/* 신과 인간, 어느 경제학자의 이야기 */

특이한 이력을 가진 교수님이 한 분 계시다.  이 분은 남들은 하나도 힘든 박사학위를 둘이나 갖고 있다.  80년대 후반에 물리학으로 박사학위를 받았고, 몇 년간 물리학과 교수로 있으면서 이론물리학 분야의 연구를 했었다.  90년대 중반에는 경제학으로 전향하여 박사 받고 이후 지금까지 경제학자로 살고 있다.  이 분 연구하시는 분야는 general equilibrium쪽인데, 경제학에서의 균형과 열역학적 균형의 개념(http://econclass.egloos.com/1704465)이 다르지 않다고 생각하는 나와는 상당히 얘기가 잘 통하는 교수님 중 한 분이다.  (사실 물리학적 균형의 개념과 경제학에서의 균형이 근본적으로는 같은 아이디어임을 수학적으로 증명한게 이 분이다.)  네트워크에 대한 연구 자체가 경제학보다는 수학이나 물리학에서 훨씬 앞서 이루어져 있기에, 지금 진행중인 연구에 대해서 많은 조언을 받고 있기도 하다.  지도교수로부터는 네트워킹 행동 자체에 대한 게임이론 측면에서 조언을 받는다면, 이 분으로부터는 네트워크의 물리적, 수학적 특성에 대한 부분을 배우고 있으므로, 지도교수만큼이나 내게는 각별한 분이다.

이 분은 독실한 카톨릭 신자다.  보통 경제학자들은 다른 사람들보다는 종교적으로 좀 시니컬한 경우가 많은데 (어디 시니컬한 구석이 종교 뿐이겠느냐만..), 보기 드물게 신실하다.  물리학자에서 경제학자로 전향한 독특한 이력을 갖고 있음에도, 17살에 처음으로 사랑에 빠졌던 여자친구(지금의 아내)만 아니었더라도, 지적 호기심이 조금만 덜했더라도 아마 천주교 사제가 되었을지도 모르겠다고 하신다.  성격은 좀 냉정하고, 시니컬하고, 학생들에게도 별로 관심없고, 말도 별로 없고, 처음 다가가기에는 상당히 껄끄러운 분인데, 학문적으로 흥미롭거나 비슷한 연구 방향이거나 하는 경우에는 관심과 지원을 아끼지 않는 분이다.  같이 연구를 하시는 분들 사이에서는 평판이 좋은데, 학생들에게는 평판이 별로 좋지 않은 그런 타입.

왜 물리학에서 경제학으로 전향했는지가 궁금해서 여쭤봤던 적이 있다.  이 분이 물리학에서 연구하던 분야는 이론물리학에서도 굉장히 철학적인 성격이 강한 쪽이었다고 한다.  빅뱅 이전의 상태는 어떠했는지, 우주는 어떻게 어디서부터 존재하게 되었는지, 우주와 시간의 기원과 관련한 이론연구를 했더랬다.  (원래 물리학이 다루지 않는 분야가 별로 없다시피 할 정도로 잡다하게 광범위한 주제를 두루두루 섭렵하고 있다고는 하지만) 얼핏 들으면 물리학이라기 보다는 철학이나 종교적 의문점에 가까운 주제들이 아닌가...  그런데 어느 순간, 자신이 하고 있는 연구 주제에 대해 의미를 잃었다는거다.  우주의 기원, 세상의 시작과 관련된 주제들을 다루다보니 궁극의 질문은 '신이 어떻게 세상을 창조했는가'로 귀결되더라는거다.  워낙 종교적으로 신실한 분이다보니, 별 것도 아닌 일개 인간이 어찌 신의 뜻을 이해할 수 있겠는가, 하는 생각이 들었고, 그 때부터 연구 의욕을 상실했다고 한다.  평생을 다 바쳐도 신의 뜻의 아주 작은 일부분조차 이해할 수 없을거란 좌절감에서 말이다.  그리고 나서 지적 호기심의 대상을 인간사회로 돌렸다고 한다.  신의 영역을 이해하는건 불가능하겠지만 적어도 신의 창조물인 인간은, 같은 인간으로서 사회와 인간의 행동에 대해서는 열심히 연구해보면 뭔가 진리에 도달할 수도 있을 것 같다는 가능성이 보였기 때문에, 그때부터 물리학을 접고 경제학을 공부하기 시작했다는거다.

"그래서, 인간사회에 대한 진리에는 좀 접근하신 것 같아요?"라는 질문에는, "바보같은 소리일지 모르지만, 진리는 지금 우리가 하고 있는 공부에는 없어.  경제학이든, 물리학이든, 그냥 난 호기심이 강한 사람이라 뭔가 생각하고 이론을 만들어내는게 좋아서 계속 공부했던 것일 뿐이지."라고 하셨다.


※ 다큐멘터리 "신의 길, 인간의 길"을 2편까지 봤는데, 이 분이 그냥 떠올랐다.

by 너구리 | 2008/08/01 18:06 | miscellany | 트랙백 | 덧글(4)

/* 시계열분석, 뼈대부터 이해하자! - (3) */

앞의 두 포스팅(http://econclass.egloos.com/1879468, http://econclass.egloos.com/1889139)에서 stationary process를 정의하고, 특성과 모형화하는 방법을 살펴보았다.  그런데, 실제로 데이터가 stationarity 조건을 만족한다고 하는 가정은 상당히 강한 가정이다.  현실에서 진짜 데이터를 분석하다보면, weak stationarity 조건을 만족하지 않는다는 문제를 쉽게 찾을 수 있다.  앞서도 언급했듯, stationarity 조건(앞 포스팅 ps 참고)은 시계열 패턴을 time domain이든 frequency domain이든 모형을 만들기 위해 꼭 필요한 가정임에도 말이다.  stationarity 조건을 만족하지 않을 경우 왜 ARMA 모형을 그냥 쓸 수 없는지 설명하기 위해 AR(1) process의 예를 생각해보자.

y_t = ρy_(t-1) + u_t, 일반적인 AR(1) 모델이다.  |ρ|<1이면 stationary process이니 OLS이든, MLE든 그냥 쓸 수 있다.  ρ의 OLS 추정치를 ^ρ라 하면, 추정치 ^ρ의 점근분포를 도출하는 과정은 다음과 같다.  (가급적이면 수식을 배제하려고 하는데, 이건 왜 nonstationary process는 다른 방법으로 접근해야 하는지를 이해하기 위해 꼭 필요한 부분이므로, 달리 설명할 수가 없다.  다행히 별로 어렵지 않으니 일단 수식을 두려워하지 말고, 그냥 억지로라도 읽어내려가보자.)  OLS 추정에서 점근분포를 도출하는 과정과 정확히 동일하므로, 이건 선형모형 책 아무거나 찾아봐도 나와있다.
옆의 식은 단순 OLS 추정치를 풀어서 쓴 것일 뿐이다.  γ_0를 0차공분산(즉, 분산)이라 하면, 2차 모먼트의 ergodicity를 만족한다고 할 때, (

ergodicity for the variance, ) 관찰치의 갯수인 T가 커질수록 ^ρ의 점근분포는 다음과 같다.

stationarity의 조건인 |ρ|<1을 만족하지 않는 경우를 생각해보자.  예를 들어, ρ=1이라면 어떻게 될까?  (※ ρ=1은 unit root라 부른다.) 위의 식에서 ρ 대신에 1을 집어넣어버리면, 분포의 분산이 0이므로, √T(^ρ-1) ㅡp→ 0, 즉, 확률적으로 특정 분포에 수렴하는게 아니라, 분포 없이 확정성만 남게 된다는 말도 안되는 경우가 되어버리므로, nonstationary data를 stationary model을 써서 추정을 하면 점근분포 자체가 다르므로, 추정치를 믿을 수 없다.

그럼 nonstationary process에서는 어떤 분포를 써야 하는지만 해결하면 문제는 간단해진다.  nonstationary process의 점근분포를 도출하기 위해서는 우선 Wiener process (또는 Brownian motion)를 이해해야 한다.  다음과 같은 특성을 가진 확률과정 W(t)를 Wiener process라고 부른다.
1. W(0)=0  : 프로세스의 시작은 원점에서부터.
2. 임의의 0≤t1<t2<...<tk≤1에 대해서 W(t2)-W(t1), W(t3)-W(t2), ... , W(tk)-W(tk-1)은 서로 독립인 Gaussian multivariate random process인데, 개별 확률변수는 W(t)-W(s)~N(0, t-s)이다. : 일정한 간격을 둔 각 프로세스의 차는 평균이 0, 분산이 간격의 크기인 정규본포이다.
3. W(t)는 확률적으로 t에 대해 연속 : 무한히 작은 단위로 프로세스를 나눌 수 있다는 뜻.
1, 2번에서 쉽게 알 수 있는건 W(t)~N(0,t)이라는 사실이다.  비너 프로세스는 특정 시점의 확률변수가 평균은 0이고, 분산은 관찰시점과 동일한 가우시안 확률과정을 따르는 것을 의미한다.  입자의 운동이나 분자의 확산 등을 설명하는데 쓰이는데, 기본적인 아이디어는, 매 순간 특정 입자는 어디로 튈지 모르는데, 다만 어느 방향으로 튈지에 대해서는 정규분포를 따른다고 보는 것이다.  따라서, 특정 시점에서 입자가 어디에 위치할지에 대해서는 그 전 단계에서 어디 있었는지 과거 확률적 움직임에 근거한다는 얘기다.

nonstationary process의 점근분포는 다음과 같다.

보기에 좀 복잡하지만, 사실 꼼꼼히 살펴보면 시점을 1 단위로 바꿨을 때, 최종 단계에서의 비너 프로세스와 이 단계까지 이르게 된 비너 프로세스의 적분값, 즉 지나온 과정의 합으로 표현되는 어떤 확률과정일 뿐이다.  도출과정은 파일로 첨부( nonstatlimitingdist.pdf)하였으니 관심있으면 참고할 것.  이 과정을 완전히 이해해야 unit root, cointegration 등의 nonstationary process와 관련된 이슈들에 대해 이해를 할 수 있기 때문에, 개인적으로는 이 도출과정을 반드시 짚고 넘어가야 한다고 생각한다.  그런데 이 포스팅은 수식을 보면 지레 겁먹을 수 있는 대부분의 사람들을 위해서 수식을 최대한 배제하고 직관과 의미만을 설명하는 것이 목적이므로, 이 점근분포의 도출과정은 포스팅 목적에 맞지 않기에, 꼭 궁금한 사람들만 읽어볼 수 있도록 파일로 첨부하였다.  (과정을 그림캡춰해서 붙이기엔 좀 길기도 하고..) 그 수식이 많아서 다소 부담스러울지도 모르겠으나, 사실 별로 어렵지 않고, 일단 왜 점근분포가 이렇게 도출되었는지를 알고 나면 nonstationary process model의 추정과 검정을 이해하는데 큰 도움이 될 것이다.



ps1. tex으로 html형식 문서를 만드는 방법 아시는 분, 도와주세요.  수식이 많이 들어가다보니 그냥 Tex으로 작성하는게 편해서 dvi 파일을 화면캡춰해서 그림으로 넣고 있습니다.  이거 좀 불편하네요.  분명 뭔가 방법이 있을것 같은데.. 아무리 찾아봐도 영..

ps2. tex은 한글입력 안되나요?


by 너구리 | 2008/07/27 07:35 | economics | 트랙백 | 덧글(3)

/* 시계열분석, 뼈대부터 이해하자! - (2) */

시계열 데이터를 이해하는데 필요한 기본적인 개념들(http://econclass.egloos.com/1879468)을 소개했으니, 시계열분석 모형으로 들어가보자.  stationary data와 nonstationary data의 경우 약간 다른 모형을 쓰는데, 우선 stationarity의 경우부터 살펴보기로 한다.

Wold theorem이 말하는 바, 모형은 기본적으로 deterministic part와 regular part로 구분한다.  데이터를 일정 시점 구간 내에서는 동일한 확률과정을 따른다는게 stationary process이므로, 문제가 되는 시차만 밝혀내는 것으로 모형을 시작해본다.  어떤 확률과정이 시차 어디까지 의존하는지를 모델링하는 것이다.


moving average, MA(q) 모델은 regular part를 현재 관찰된 값이 과거 q기까지의 오차항의 합으로 본다.  즉, Y_t = μ + Σ θ_j*ε_t-j, j=0, ... , q.  autoregressive process, AR(p) 모델은 과거 p기까지의 관찰값으로 현재 관찰값의 regular part를 표현한다.  즉, Y_t = c + Σφ_jY_t-j + ε_t.  AR process는 과거 관찰값의 합으로 현재를 표현하므로, MA(∞) process로도 표현이 가능하다.  (AR(1) process에서 Y_t-1을 Y_t-1 = c + Σφ_jY_t-1-j + ε_t-1로 바꿔서 계속 반복해보면 쉽게 증명할 수 있다.)  이는, 현재 관찰값을 과거 오차항으로 표현하든, 과거 관찰값 자체로 표현하든 모델만 달리 표현하더라도 어쨌든 본질은 바뀌지 않는다는 얘기다.


위와 같이 시계열 모형을 white noise의 합으로 나타내는 이유는 autocovariance 때문이다.  즉, 과거 어느 시점이 현재 시점과 독립이 아니므로, 과거를 통해 현재를 표현하는 것이 AR, MA 모형이다.  다른 각도에서 생각해보면, 과거부터 현재까지를 관통하는 어떤 법칙이나 패턴을 모형화한 것이라고도 할 수 있겠다.  이런 관점에서 AR, MA모형은 과거 얼마나로부터 현재를 표현할 수 있는지를 말해주는 사이클이다.  수학적으로는, 사이클을 표현하기에 적당한 함수가 바로 삼각함수다.  적절하게 삼각함수를 조합하면 AR, MA 모형과 마찬가지로 데이터가 보여주고 있는 주기성을 표현할 수 있다.  stationary data의 autocovariance를 Fourier transform을 통해 frequency domain으로 바꿔서 모형을 표현할 수 있는데, 이는 원래 데이터에서 과거의 정보의 합으로 표현한 패턴을 사이클로 바꿔 표현한 것일 뿐이다.  따라서, frequency domain으로 표현을 바꿈으로서 데이터의 패턴을 주기와 길이로 표현되는 일종에 사이클의 조합으로 보여줄 수 있고, 가장 dominant cycle을 찾아낼 수도 있다.

모형의 형태를 파악했으니 추정을 해야하는 문제가 남아있다.  stationarity & ergodicity를 만족하는 데이터는 일반적인 회귀모형에서와 마찬가지로 MLE 방법을 이용할 수 있다.  즉, 각각의 관찰값에서 Gaussian white noise process를 따른다고 할 때, density function을 f(y|θ)=(2π)^(-T/2)|Ω|^(-1/2)exp[-1/2 (y-μ)'Ω^(-1)(y-μ)]이므로, 이를 최대화하여 모수를 추정하는 과정은 회귀모형에서의 MLE 과정과 동일하다.

다음번에는 nonstationary process에 대해 다뤄볼 것이다.

by 너구리 | 2008/07/22 20:42 | economics | 트랙백 | 핑백(1) | 덧글(2)

/* 시계열분석, 뼈대부터 이해하자! - (1) */

계량경제학 시리즈 1(http://econclass.egloos.com/1733546), 2(http://econclass.egloos.com/1734756)에 이어, 이번엔 시계열분석을 정리해볼까 한다.  굳이 시계열분석을 정리하는 이유는, 한국에서 통계학과 석사과정에 있을때 세부전공이 시계열이었다는 아련한 향수라는 지극히 개인적인 이유와, 경제학 실증연구에서 시계열 데이터를 다루어야 하는 경우가 상당히 많기 때문이다.  물론 덧글로 시계열도 정리해달라는 얘기도 있긴 했지만, 지금 같이 공부하는 박사과정 친구들 중에서도 시계열분석의 기본적인 로직에 대한 이해 없이 분석방법들만 무작정 들이미는 경우도 종종 보아왔던 것도 이 글을 쓰는 이유 중 하나이다.  데이터 분석 방법이나 통계분석 패키지를 마치 자판기에서 커피 뽑아 마시듯 여기는 사람들이 많이 있는데, 엄밀히 말하자면 데이터 분석은 테크닉이 아니라 아트(art)다.  근저에 깔린 논리와 개념을 이해하고 아는만큼 정확하게 데이터 자체의 특징에 잘 맞는 방법을 사용하여 분석할 수 있다.  사실 시계열이 언뜻 복잡하기만 한 수식으로 뒤덮여서 어렵게 보이기는 하지만, 앞서 계량경제학 포스팅에서와 마찬가지로, 수식의 밑에 깔린 논리를 이해하기만 한다면 그리 어렵기만 한 것도 아니다.  하여, 이 포스팅에서는 최대한 수식을 배제하고, 시계열 데이터의 특성과 개념을 중심으로 다루기로 한다.


시계열 데이터의 특성을 이해하기 위해서는 확률과정(stochastic process)이라는 수학적인 개념을 먼저 이해해야 한다.  어떤 확률변수 Y가 있다고 하자.  그리고 이 확률변수의 각 시점에 따른 관찰값이 {y_i}={y_1, y_2, ... , y_t}로 주어져 있다고 해보자.  각 시점에서의 y_i는 특정한 확률과정을 따르는 확률변수 Y의 실현값(realisation)이다.  예를 들어, 매일 아침 10시에 혈압을 잰다고 해보자.  한 달간 혈압을 측정했을 때, 30개의 데이터를 확보했다.  혈압이 특정한 확률과정을 따른다고 하면, 매일 측정한 데이터 각각은 이러한 확률과정을 따르는 혈압이라는 확률변수가 실제로 관찰된 실현값이 되는 것이다.  여기서 시계열 데이터가 일반적인 선형모형에서 가정하고 있는 데이터와의 중요한 차이점이 드러나는데, 바로 실현값이 딱 하나 뿐이라는 점이다.  즉, 해당 시점에서 관찰가능한 확률변수는 오로지 한 개 뿐이기 때문에, 이를 바탕으로 모형을 추정할 수 없다는 문제점이 발생한다.  활용 가능한 데이터는 각 시점마다 한 개씩 t시점의 t개이고, 특정 확률과정에 따른 유일한 데이터를 가지고 모형을 만들기 위해서는 어떻게 해야할지에서부터 고민을 시작하는거다.

이런 문제점을 해결하기 위해 stationarity의 개념을 들고온 것이다.  stationarity란, 임의의 j1, j2, ... , jn에 대하여 (Y_t, Y_t+j1, ... , Y_t+jn)의 결합확률분포(joint distribution)가 시점 t에 의존하지 않고 j1, j2, ... , jn에만 의존한다고 정의한다.  직관적으로 보자면, 전체 활용 가능한 데이터 t개를 동일한 구간으로 나누었을 때, 각 구간 내에서 관찰된 데이터들의 확률과정이 관찰된 시점 그 자체와는 상관없이 구간의 크기에만 의존하므로, 동일한 갯수의 연속된 관찰값에 대해서는 시차와 상관없이 같은 확률과정을 따른다고 여기는 것이다.  stationarity의 개념을 도입함으로서 단 한 개의 관찰값이라는 문제점을 해결하여 시차에 따른 복수의 활용가능한 데이터를 확보할 수 있는 것이다.  따라서, stationary data의 경우는 일반적인 선형모형에서 쓰는 OLS, MLE 등의 추정, 검정법을 그대로 사용할 수 있다.

stationarity를 만족하는 데이터라고 할지라도, 시차에 따라 각 시점마다 분포의 파라미터가 변한다는 문제점이 아직 남아있다.  이 부분을 보완하기 위해서 ergodicity의 개념을 도입하는데, 특정 기간 내에서 관찰된 T개의 데이터의 sample moment가 T가 커짐에 따라서 전체 확률분포의 moment와 확률적으로 근접한다는 개념이다.  즉, E[y_T]→μ as T→∞이면 ergodic for the mean, 즉 1차 moment인 mean에 대해서 ergodicity이고, 이는 2차, 3차, n차 moment까지 동일하게 확장 가능하다.  ergodicity가 의미하는 바는 선형모형에서의 대수의 법칙(law of large numbers)이다.  즉, 시점마다 확률과정을 다르게 추정해야 한다는 문제점이 있지만, stationary data가 ergodicity를 만족한다면 해당되는 시차만큼의 구간에서는 대수의 법칙에 따라 점근적으로 동일분포를 따른다고 볼 수 있다.

여기까지 요약하자면, stationarity와 ergodicity는 유일한 관찰값(single realisation)이라는 문제점을 보완할 수 있는 개념이고, 이 두 가지를 만족하는 데이터는 선형모형에서와 동일한 추정, 검정을 통해 모델링이 가능하다.

그럼 어떻게 시계열 데이터를 모델링 할 것인지에 대한 얘기로 넘어가자.  기본적으로는 선형모형과 동일하다.  CLRM에서의 제일 첫 번째 가정, fixed regressor를 돌이켜 생각해보자.  이 가정은 종속변수를 비확률적 요인과 확률적 요인으로 구분한다.  마찬가지로 시계열 데이터도 확률적 요인과 비확률적 요인으로 구분하는 것이 기본적인 모델인 Wold theorem이 말하고 있는 것이다.  즉, Y_t=Y_1t+Y_2t로 나타내는데, Y_1t는 과거 관찰값으로 예측할 수 없는 regular part이고, Y_2t는 과거 관찰값으로 완벽하게 표현할 수 있는 deterministic part이다.

본격적으로 stationary model을 말하기 전에 알아야 하는 개념이 white noise다.  (시계열에서는 좀 미리 알아둬야 하는 개념들이 좀 많다..)  다음의 네 가지 조건을 만족하는 확률과정을 white noise라고 한다.  (1) E(ε_t)=0 (평균이 0), (2) E(ε^2_t)=σ^2 (분산이 일정), (3) E(ε_tε_s)=0, t≠s (시점이 다른 관찰값은 uncorrelated), (4) ε_t와 ε_s는 독립.  Wold theorem에서 Y_1t에 해당되는 regular part가 white noise로 표현되는 부분이다.  시계열분석 모형에서는 각 시차의 white noise process를 통해 특정 시점에서의 확률과정을 추정한다.  즉, 특정 시점에서의 확률과정은 white noise process의 선형결합으로 표현할 수 있다.  이를테면, 햇빛은 그냥 보면 무색이지만, 프리즘을 통해 햇빛을 빨강부터 보라까지의 7가지 색의 결합으로 분해할 수 있는 것과 같다.

stationarity & ergodicity를 만족하는 데이터에 대해서는 MA(moving average) 또는 AR(autoregressive)로 모델링 할 수 있다.  쓰다보니 또 길어져서, MA, AR 모형부터는 다음 포스팅에서 계속 이어서 써볼 참이다.  다음 포스팅에서는 MA, AR 모형의 특징과 추정법, 의미를 다룰 예정이고, 이 모형을 frequency domain으로 바꿔서 표현하는 이유에 대해서 다루도록 할 것이다.  아마도 이게 길어지면 그 다음 포스팅에서 nonstationarity의 경우 어떤 확률과정을 따르고, 어떻게 모형화 할 것인지 등, nonstationarity data에 대하여 집중적으로 다루고, 그 외의 continuous time model, heteroskedasiticity를 다루는 모델 등 특수 문제들을 언급할 예정이다.


ps. stationarity의 개념에 대해 추가설명 (weak stationarity & strict stationarity)

왼쪽의 그래프는 추세가 있는 stationary process이다.  그래프를 보면 stationarity에 대한 개념을 더 직관적으로 이해할 수 있을 것 같아서 좀 더 부연설명을 하자면, stationarity는 강한 의미의 stationarity와 좀 관대한 기준의 stationarity로 구분한다.  강한 의미의 stationarity는 앞서 설명한 것과 같이 정의되는데, 문제는 시점마다 하나씩의 관찰값만으로는 그 결합확률과정을 알 수 없다는 것.  그래서 실제로 stationarity의 개념을 데이터 분석에 활용 가능토록 하기 위해 확률과정이 동일하다는 개념을 2차 모먼트까지만으로 제한한 것이 weak stationarity이다.  즉, 1차 모먼트인 평균, 2차 모먼트인 분산/공분산만 놓고 stationarity 기준에 부합되는지 아닌지를 보는 것이다.  옆의 그래프에서와 같이, 평균은 시점 그 자체가 아니라 시차(이 경우에는 시차 10)에 의존하며, 분산(빨간색 화살표)은 일정하고, 각 시점이 다른 데이터끼리는 서로 독립임을 알 수 있다.  쉽게 얘기해서, weak stationarity는 데이터를 같은 크기의 구간으로 어디를 잘라서 보더라도 1차, 2차모먼트까지 일치하는 확률과정을 말한다.

by 너구리 | 2008/07/19 07:58 | economics | 트랙백 | 핑백(2) | 덧글(6)

/* 대가의 존재감 */

캠브리지에서 G교수가 주관하는 디스커션그룹에 들어가게 된지 6개월째.  본격적으로 리서치과정을 시작하면서 무엇보다 세미나를 통해 많은 것을 배워나갔는데, 특히나 이 소수정예 디스커션 그룹의 세미나는 딱 이 그룹이 아니라면 세상 그 어디에서도 배울 수 없는 것을 배워나갈 수 있는 자리였고, 다들 나와 마찬가지로 경제학에서도 마이너인 분야를 '자발적'으로 선택해서 공부하고 있는 네트워크 오타쿠들인지라 내가 진행하고 있는 연구에 대해 가장 공신력있는 평가를 받고 의미있는 피드백을 얻을 수 있는 자리였다.  그렇기에 지도교수와 나는 100km를 달려 2주에 한번씩 빠지지 않고 캠브리지로 가는 것이다.

이 그룹의 기본 멤버는 G교수와 그 밑의 박사과정 3년차 학생 2명, 내 지도교수와 나, visiting prof.으로 와있는 K교수 이렇게 6명이고, 매번 한 두명의 게스트가 바뀌곤 한다.  내 지도교수의 박사과정 지도교수였던 G교수는 벌써 10년째 이 모임을 계속해나가고 있고, K교수는 이들과 같이 논문을 쓰기 시작한 5,6년 전부터, G교수 밑에 박사과정 2명은 3년차이니, 이 모임은 짧지 않은 세월동안 꾸준히 계속되어왔다.
보통은 돌아가면서 자기가 진행중인 연구를 발표하거나, 이 분야에 새로 나온 논문을 같이 살펴보며 평가하곤 하는데, 멤버들 중에서 내공으로는 이제 1년차를 마친 내가 제일 바닥이다보니, G교수는 내가 이 모임을 통해 얼마나 배워나가고 있는지에 관심을 많이 보인다.  이 모임을 통해 성장해나가는 내 공력이 바로 이 모임 자체의 바로미터인 셈.  이런 의미에서 어제 세미나 끝나고 같이 점심을 먹는 자리에서 G교수는 내게 반년간의 이 세미나를 통해 뭘 배웠느냐고 물었다.

생각해보면, 새로 나온 논문을 읽으며 이론을 공부하는건 (얼마나 신속하게 새 연구를 접하느냐 하는 속도의 차이는 좀 있겠지만) 혼자서도 할 수 있다.  그러나 여기 세미나를 통해 배우는건 이론이나 지식 그 자체가 아니라, 어떻게 공부를 해나가느냐, 어떻게 사고하느냐, 어떻게 연구를 진행시키느냐, 하는 'how to'에 대한 것이 훨씬 더 크다.  이런 부분은 혼자서 해나가는데 한계가 있을 뿐더러, 대가 밑에서 그 방식 그대로를 배우는 것과 그냥 그럭저럭 보통수준의 방식을 배우는 것의 차이점이 너무나 분명하기 때문이다.  말하자면, 영업사원이 판매왕 사수 밑에서 배우는 노하우와 보통의 사수 밑에서 배우는 노하우의 차이랄까.  딱 꼬집어서 말하기 힘든 부분이지만 분명히 존재하는 차이점을 배워나간다.  게다가 이 모임은 일방적인 가르침이 아니라 끊임없는 상호작용과 공동작업을 통해 더 향상된 수준에 도달하는 것이 가능한 소규모 그룹이기에, 내가 이 그룹을 통해 얻을 수 있는 것은 다른 어떤 수업이나 세미나에서도 얻기 힘든 부분이다.  영국의 도제 시스템인 박사과정의 장점이 극대화된 모임이라고 해야할 것 같은데, 이런 그룹에서 대가인 G교수나 지도교수나 다른 멤버들이나, 앞으로도 이 분야의 연구를 계속 같이 해나갈 파트너의 입장이기까지 하니, 공부하기에 이보다 더 좋은 환경이 어디 있겠나.

by 너구리 | 2008/07/15 18:59 | student life | 트랙백 | 덧글(2)

/* 연역과 귀납 */

중,고등학교 과정에서 누구나 배우는 연역법/귀납법의 차이를 요즘 논문을 쓰면서 구체적으로 깨닫고 있는 중이다.  중고등학교때는 쓸데없이 이런걸 뭘 가르치나 싶던 것인데, 지식 생산자의 입장이 되어보니 서로 다른 논리적 접근방식이 어떤 차이가 있는지, 각각의 장점과 한계는 어떤 것인지 체험으로 알게 되었다고나 할까..

이론연구를 진행하다보면, 모델을 만드는 과정에서 연역적으로 접근할 것인가, 귀납적으로 접근할 것인가를 선택할 수 있다.  (항상 그런건 아니지만,) 물론 둘 다 번갈아가며 활용하는 것이 이상적이지만, 연구자의 개인적 성향에 따라 조금씩 다를지도 모른다.  섣불리 일반화하긴 좀 그렇지만, 수학적 논리전개에 강한 사람들은 우선 연역적으로 문제를 풀어가고, 직관이 강한 사람들은 먼저 귀납적으로 접근하는 경향이 좀 있다.

모델의 기본적인 틀(가정을 포함한 각종 셋팅)을 바탕으로 논리를 전개하여 결론에 도달하는 연역적 방식은, 이론을 일반화하기 쉽다는 장점이 있다.  '이러이러한 상황과 가정 하에서는 요런 결론을 얻는다'라는 명제를 연역적으로 증명했다면, 앞서 전제한 상황과 가정에 맞는 모든 경우에 예외없이 해당된다.  따라서 설사 귀납적 추론을 통해 결론에 도달했을지라도 결론 자체에 대한 연역적 증명은 이론을 만드는데 반드시 요구되는 사항이다.
기본 상황과 가정이 들어맞는 구체적인 사례를 생각해보고, 이러한 사례들의 공통된 특징을 찾아내는 귀납적 연구방법은 염두해본 예를 제외한 다른 가능성이 존재할 수도 있으므로 결론을 일반화하기 어렵다.  말하자면, 여러가지 사례들을 놓고 보았을 때, '이런 상황 하에서는 이런 결과가 나올 것이다'라는 추측은 가능하지만, 이러한 추측이 수만가지 사례를 고려했을 때 사실이었더라도 단 한 가지 반례만 나오게 되면 틀렸다는 것이 증명된다.  게다가 구체적인 사례들을 통해 드러나는 특징을 관찰할지라도 이러한 특징이 왜 나타나는지에 대한 답을 찾기 어려운 경우도 드물지 않게 발생한다.

일반화된 이론으로 증명할 수 없다는 결정적인 한계에도 불구하고 귀납적 추론이 이론연구에 반드시 필요한 이유는, 이론 자체에 현실성을 부여해주기 때문이다.  연역적으로 어떠한 결론에 도달했을 때, 그 결론이 단지 논리적인 귀결일 뿐, 현실에 대한 아무런 직관을 제시하지 못한다면 경제학 이론으로서는 별로 의미가 없다.  그것이 수학연구와 경제학연구의 가장 큰 차이점이다.

진행중인 논문에서 이론을 절반쯤 완성해놓고, 제3자의 시각으로 되짚어보는 기회가 있었는데, 도출된 결론이 수학적으로 너무나 복잡한 형태인지라, 직관적으로 머리속에 떠올리기 어렵다는 의견이 있었다.  바로 지금이 귀납적 추론을 통해 이론에 생명력을 불어넣어야 할 시점인거다.  이론연구를 진행할 때, 연역적으로 도출해낸 결론이 현실적으로 어떤 의미를 가지는지 구체적인 사례들을 떠올리며 귀납적으로 직관을 담아내는 과정이 필요하다.

by 너구리 | 2008/07/15 17:16 | economics | 트랙백 | 덧글(0)

/* incomplete information & bargaining */

"오늘 어떤 글을 읽다가 대한민국이 투기자본의 표적이 되기 좋은 대상이고 투기자본의 공격에 원활히 대응하기 위해선 충분한 외환보유고가 필요하다는 내용을 발견했습니다. 무슨말인지 대강은 알겠는데, 그 구체적인 메커니즘에 대해선 분명히 떠오르는 것이 없거든요."
위의 덧글을 기초로 정보와 옥션, 협상에서 균형가격 결정에 대한 얘기를 엮어볼까 합니다.  구체적으로 어떤 글을 읽으셨는지 알지 못하여, 그냥 외환시장을 말하는 것이겠거니 미루어 짐작하고 쓰겠으니 양해바랍니다.


외환을 포함하여 금융시장은 기본적으로 다수의 거래자가 bid-offer를 반복하여 가격이 결정되는 strictly competitive game(뭐라고 번역해야 할지 몰라서 그냥 씁니다.  누군가의 이익은 누군가의 손해를 의미)입니다.  엄밀히 말하자면 다수의 거래자가 bid-offer를 반복하여 제시하고, 그 중 가장 높은 bid & 가장 낮은 offer에서 가격이 결정되는 구조이지요.  (bargaining game of alternating offers with multiple players + first price auction이 합쳐진 형태입니다.)

그렇다면 buyer와 seller의 입장에서 각각 어떻게 가격을 제시하는지 살펴봅시다.  우선 buyer i의 payoff는 특정 거래 대상에 대한 개인적 가치(private value)를 Xi라 하고, 제시금액(bid)을 Bi라고 할 때, payoff는 다음과 같습니다.
pi_i=Xi-Bi  if Bi>Bj, i≠j
pi_i=0        otherwise
이 때, buyer의 의사결정은 max pi_i s.t. Bi≤Xi 단순화시킬 수 있겠지요.  최고가경매(first price auction) 매커니즘에서는 항상 Bi=Xi가 buyer의 weakly dominant strategy이니 buyer는 거래 대상에 대한 개인적 가치만큼의 가격을 제시합니다.
Seller의 입장에서 보면, 거래 대상 고유의 가치를 V라고 할 때, seller의 payoff는 Bi-V입니다.  seller는 Bi가 클수록 이익이 커집니다.  seller도 buyer와 동일한 과정으로 가격을 제시합니다.

이렇게만 보면 매우 간단한 구조입니다만, 의외로 그렇지 않은게 buyer에게는 V가, seller에게는 Xi가 알려지지 않은 정보(private information)인거죠.  다수의 시장참여자가 존재하는 bargaining game of alternating offers라고 시장을 정의했지요.  buyer는 거래 대상의 가치를 모르고, seller는 buyer의 개별적인 가치를 모르는 상태에서 양쪽이 번갈아 bid-offer를 제시한다고 합시다.  양쪽은 상대방의 숨겨진 정보에 대한 기대값을 사용하여 가격을 제시할 것입니다.  이를테면, seller가 가격을 제시할 때, Xi를 모르므로, Xi 대신에 조건부기대값 E[Xi|Bi≤Xi]을 바탕으로 의사결정을 합니다.  Xi=Bi가 i의 dominant strategy이므로, seller의 의사결정은 다음과 같습니다.
max Bi-V=Xi-V, Xi는 private information이므로 이를 기대값으로 대신하면, max E[Xi|Bi≤Xi]-V
이 때, buyer의 의사결정은 다음과 같습니다.
Accept if E[Xi|Bi≤Xi]≤Xi
otherwise, Reject
다수의 시장참여자가 존재하므로, private value보다 높은 수준의 offer는 응하지 않으면 그만인거죠.  따라서 buyer의 payoff는 최소한 0보다는 크거나 같습니다.  즉, Xi-min(Bi, E[Xi|Bi≤Xi]) ≥ Xi-Bi=0 이 됩니다.  seller도 마찬가지로 의사결정을 하므로, buyer와 seller 양쪽이 모두 private information을 가지고 있는 incomplete information market에서는 균형가격에서 buyer, seller 모두 0 payoff를 갖게 됩니다.  (다수의 동일한 시장참여자라는 가정 하에서.. Xi, V와 그 기대값이 다른 경우는 nonhomogeneous multiple players market이므로 조금 복잡한 경우를 생각할 수도 있긴 합니다.) 

투기라는 것은 0 payoff에서는 발생하지 않습니다.  투기, 특히나 금융시장에서 투기자본은 차익거래를 통해 이윤을 창출하는데, 차익거래가 가능한 것은 buyer와 seller 양쪽의 정보비대칭이 균형을 잃은 것으로 설명할 수 있겠군요.  즉, 위의 모델에서 보면 buyer의 입장에서 Xi가 더 이상 private information이 아닌 경우에, seller는 E[Xi|Bi≤Xi] 대신에 Xi만큼만 제시할 수 있고, buyer는 여전히 seller의 private information V에 대해 기대값으로 의사결정을 하게 되면, buyer가 0보다 큰 이익을 가져갈 수는 없는데 seller는 0보다 큰 이익을 가져갈 가능성이 존재하게 되는 것입니다.  이 때, 만약 buyer의 Xi가 충분히 작은 값이어서 Xi-V도 거의 0에 가깝다면 seller는 정보획득을 통한 bargaining power의 우위가 별로 의미가 없겠지요.  정보를 알고 있으나 모르고 있으나 payoff는 별로 달라지지 않으니까요.  말씀하신 외환보유고 부분이 바로 충분히 작은 Xi로 설명할 수 있겠습니다.  상대방이 내 정보를 알아도 상대방이 그로 인한 이익을 취할 가능성을 없애버리면 투기에 의미가 없으니까요.

궁금하신 부분에 답이 되었는지 모르겠습니다.  사실 제가 금융시장에 대한 지식이 별로 없어서 특수성을 최대한 배제하고 일반적인 시장 매커니즘을 통해서 설명할 수밖에 없었습니다.

궁금하신 부분은 다음의 자료를 통해 깊이 공부하실 수 있습니다.
Muthoo (1999), Bargaining Theory with Applications, Cambridge University Press
Osborne and Rubinstein (1994), A Course in Game Theory, MIT Press
Aumann (1975), "Values of markets with a continuum of traders", Econometrica
Binmore, Rubinstein, and Wolinsky (1986), "The Nash bargaining solution in economic modelling", Rand Journal of Economics

by 너구리 | 2008/07/11 03:12 | economics | 트랙백 | 덧글(2)

◀ 이전 페이지다음 페이지 ▶