resampling을 이용한 방법 (bootstrapping)
resampling이란 모분포의 형태를 알 수 없을 때, 현재 갖고 있는 데이터의 일부분을 재추출하여 분포를 만든 후 관측하는 값의 통계적 의미를 확인하는 방법이다. 우선 estimate 에 대해 살펴 보고 넘어 가자. 일련의 데이터가 있을 때, 우리는 그 데이터의 총체적 특성을 나타내는 값으로 보통 '(산술)평균'을 이용한다. 즉, 평균이란 데이터 집합의 특성을 표현하기 위한 수치 중 하나의 예일 뿐이다. 최대, 최소, 중간값, 모드, 표준편차, skew, n-th moment 등 데이터 집합의 특성을 표현하기 위한 값에는 매우 많은 종류가 있다. 이 글에서는, 데이터가 주어지면 그 데이터를 이용하여 하나의 실수값을 계산해 낼 수 있을 때, 그 실수를 estimate 라 지칭한다. 보다 정확한 정의는 ..
2010. 7. 2.
구름, 노을, 그리고...
이미 해지는 많이 넘어간 어느 시간. 언제 비가 온다고 해도 전혀 이상할 것 없을만큼 흐린 날씨. 그 중에도 구름이 아직 채 채워지지 않은 곳이 있고, 그 곳엔 낮은 구름 위로 저 높이 떠 있는 새털구름도 살짝 보이고, 그리고, 더 멀리서 아직은 사라지지 않은 태양빛이 구름에 반사되어 만들어진 풍경. 그리고... 저 멀리 한 구석에서는 붉은 노을까지 살짝 보였다. 먹구름과 흰구름이 하늘과 바람, 강물 흐르는 소리와 사람 소리, 밝은 빛과 어울려진 어느 토요일 오후, 여의도. 노을만 본다 치면, 서강대교를 앞으로 두고 제법 도시적인 배경과 어울린 모습. 왠지, 다소 음산하고 긴장감 넘치는, 비가 언제 쏟아질지 모르니까, 때, 어느 곳인가에서 하늘이 보이면 많이 안심이 되곤 한다. 태풍이 지나면서 처음으로 ..
2010. 6. 29.