본문 바로가기

분류 전체보기691

자료에서 의미를 찾아 내는 것 자료(데이터)를 보고 제일 먼저 확인하는 것은 적당한 통계적 방법에 의한 연구자의 가설 검증이 된다. 즉, 내가 이런 생각이 맞는지 확인하고자 하였는데 이 데이터는 그것을 지지하는가? 하는 것. 연구자가 일정한 논리전개(흔히 '스토리'라고 하는)를 갖고 있을 경우, 각 단계마다 이러한 절차를 반복하게 된다. 그런데, 나의 경우에는 자주, "어떻게 나올까?" 하고 일단 데이터를 만들어 본다. 물론 이 경우에도 데이터의 경향이나 특성을 미리 예측하기 때문에 데이터를 다 만들었을 때 그 예측의 성립 여부를 제일 먼저 확인하게 된다. 문제는 그 다음인데, 일단 가정했던 경향을 확인한 후, 데이터를 물끄러미 바라보고 있으면 왠지 뭔가 더 이야기를 할 수 있을 것 같은데, 손에 잡히지 않는다. 바로 이 단계가 문제.. 2011. 5. 14.
두 항목의 순서를 무시한 중복 확인하기 자료형이 두 항목으로 되어 있을 때, 순서를 무시하고 중복을 확인하는 방법을 알아 보자. 좀 더 쉽게 설명하면, 자료가 (A,B) 처럼 두 개의 항목이 쌍으로 있을 때, (A,B)와 (B,A)를 같은 것으로 간주하여 중복된 것을 제거하는 방법. 만약 코딩을 하려 한다면 그냥 하면 되고, 엑셀을 이용해서 가끔 이와 같은 작업을 해야 할 때가 있는데 이 때는 약간의 잔재주가 필요하다. 방법은 간단하다. A, B, C, ... 각 항목에 중복되지 않는 소수(prime number)를 부여한다. 그 이후, (A,B)의 값을 A와 B에 부여된 소수의 곱으로 할당해 준다. 이렇게 하면 곱한 수가 같으면 같은 쌍이거나 순서가 뒤바뀐 쌍이다. 이 두 경우가 아닌데 곱한 값이 같을 수는 없다. 왜냐 하면, 두 소수 p,.. 2011. 5. 13.
뒤틀린 시간 오래간만에 고향 집에를 갔다. 평소에는 매주 갔었지만 요즘엔 약간 일이 좀 있어서 한달만에 가게 되었다. 계산된 행로를 거의 틀리지 않게 거쳐 집에 도착해서, 으레 그랬던 시간들을 보내고 잠을 자려고 거실에 자리를 마련하고 누웠다. 조카가 오면 내 방 침대가 작아서 주로 거실에서 조카와 함께 자곤 한다. 불도 끄고, tv도 끄니, 약간의 달빛과 가로등 불빛만이 남아 있다. 조금 열어 놓은 창문으로 시원한 바람이 쉬지 않고 스며들어 왔다. 갑자기, 모든 것이 뒤엉키는 느낌이 들었다. 현실과 상상, 공상. 현재와 미래, 과거. 지금 이 공간에서 10년 전, 5년 전으로. 5년 전의, 50년 전의 다른 공간으로. 어디에 존재하는지 알 수는 없으나 기억 속에 머물고 있는 어느 공간에, 특정되지 않은 시간에 대한.. 2011. 5. 10.
낙담을, 조금만 하려구 틀린 것 까지는 아닐지라도, 생각했던 것보다는 덜 의미있다는 결론을 접했을 때. 이것저것 더 해 볼 것이 있음에도 불구하고 별로 하고 싶은 마음이 없다. 그래프로 그렸을 때 확연히 차이가 나게 나왔으면 더 좋았으련만, p-value 가 0.0001 보다 작게 나오긴 하지만 (그리고 이 값 자체도 over-estimation 된 것이라는 것이지만) 기대했던 것과는 좀 많이 다르게 나와서, 비록 '이게 의미가 있는 건가', 정도까지는 아니지만 더 하고 싶은 마음이 들지 않는다. 음... 어쩌면 내가 너무 높은 기준을 생각했었는지도 모르겠다. 확실히... 의미는 있는 것인데, 난 90%도 아니고 100%를 원했으니... 이런 적이 이번 만은 아니다. 그러니까, 어떻게 보면 객관적으로는 의미있는 것에 대하여 나.. 2011. 5. 7.