본문 바로가기
연구관련/연구_생각

생물학에 대한 회의, 를 넘어서

by adnoctum 2010. 6. 3.
2009-06-13 07:51


   얼마 전 넋두리 섞인 글 말미에 내가 의심하던 것을 지지해 주던 논문들을 찾았다고 말을 했었는데, 요 며칠 그 논문들을 조금 살펴 보기도 하고, 지금까지 내가 접해 왔던 생물학에 대한 내용을 뒤돌아 보면서, 커다란 회의를 느꼈다. 그 논문들의 제목만이라도 잠깐 살펴 보면,

* Why most published research findings are false, 2005 PLoS Med 2(8) e124
* Genetic associations: false or true? TRENDS in Molecular Medicine 2004, vol.9, pp135-138
* Any casualties in the clash of randomised and observational evidence? BMJ 2001 vol.322, pp879-880 (editorial)
* Epidemiology Faces Its Limits, Science 1995, vol.269, pp.164-169
* Problems of reporting genetic associations with complex outcomes, Lancet 2003 vol.361, pp.856-872
* Microarrays and molecular research: noise discovery? Lancet 2005 vol.365, pp.454-455

이와 비슷한 의미로 genetic association study가 사실은 과장되었을 수도 있다는 내용[각주:1]이 한 두 달 전 PLoS Genetics 였나에 나오기도 했고, 이번 주 월요일 Nature News에 "Too few women in clinical trials?" - Cancer-drug studies fail to reflect true incidence of disease in the population 란 글이 올라 오기도 했다. 그리고 다른 순수과학 혹은 수학 분야의 사람들이 말하듯이 "과연 생물학을 자연'과학'이라 말할 수 있는가?' Can a biologist fix a radio? 라는 유명한 논문에서도 볼 수 있고, 대부분의 사람들이 신경을 쓰지 않았겠지만 영화 Beautiful Mind에서 존 내쉬가 도서관에서 학생들과 얘기하던 장면의 한 대사, "생물학자들과는 말도 하지 마라"(ㅋㅋㅋ) 에서도 대충 짐작할 수 있고, 그리고 무엇보다 주위를 둘러 봐도 생물학좀 하려다 과학이 아닌 것 같아서 다른 분야로 간 많은 사람들. 단순한 사실을 나열하는 것이 결코 과학이 아니므로, 대부분의 연구가 그렇게 진행되는 것처럼 보이는 생물학을 과연 '과학'이라 할 수 있는가?

   또, 요즘들어 여러 논문을 보면서 느끼는 것인데, '모든 것이 모든 것에 연관되어 있다'. 이 말이 단순히 말장난이 아니라, 어떠한 신호 전달에 관한 논문을 보더라도 항상 "면역, 생장, 세포사멸, 발달과정에 밀접하게 연관되어 있다"란 말이 나오거든... 도대체 온갖 군데에 오만가지가 다 관여하고 있다는, 그냥 멋대로 말해도 대충 맞아 들어가는 것 같은 이 분위기는 뭐란 말인가?

   이미 저 위와 같은 논문들을 읽은 상태에서, 그리고 나 스스로도 과학적 발견이라는 것과 그 의미에 대해 많은 회의를 하는 성격에, SVM이나 PCA, LDA 같은 machine learning 기법으로 나오는 결과에는 더욱 회의적이다. 과학의 핵심은 '인과과계'를 설명해 주는 모델을 제시해 주는 것인데 machine learning 에는 '인과관계'가 숨어 있는 경우가 많거든, 특히 SVM. 데이터를 그래프와 맞추어야 한다고? 그런 건 이미 너무 쉬운 문제일 뿐이고, 거기서 얻어내는 사실이 과연 얼마나 타당한지가 문제가 되는데, k-fold cross-validation, 그리고 그에 더해 bagging 을 하든 boosting 을 하든 한계가 있다잖아... (내가 5-fold cross-validation 으로 증명하다가, classifier의 성능은 괜찮은데 좀 이상해서 이 방법을 의심하기 시작했고[각주:2], 때마침 관련 논문이 눈에 띈 것이거든)


   그런데 생각해 보면 그렇다. 순수과학 중 화학이나 물리, 그리고 수학은 이미 꽤 오랜 기간의 성숙기간을 거쳤다. 최소한 모두 백년은 넘으니까. 그런데 분자생물학이 현재와 같은 방법으로 본격적으로 연구가 시작된 것은 최대한 많이 잡아 보아도 60년밖에 안된다. 왓슨과 크릭이 유전 물질이 DNA이고, 그 구조를 발견 및 제시하고부터 뭔가 좀 진행되기 시작했으니까. 더구나, 그 당시에도 기술의 한계 때문에 제대로 된 분자생물학 연구는 PCR이 발명된 이후인 1980년대 중반 이후부터나 가능했다고 생각할 수도 있으니까. 그러니까, 지금 우리가 말하는 '생물학'은, 꽃밭에서 꽃을 색으로 구분한 후 다음 세대에 어떤 색이 나올까, 하는 것이 아니고 '분자'생물학인데, 그 분야는 이제 겨우 막 태동기를 지났을 뿐이라는 것이다. 그런 분야에 대해, 이미 천 년이 넘게 진행되어 온 수학과 같은 기준을 요구한다는 것은 조금(?) 무리가 있지 않을까? 그리고, 특히나 '사람' 가지고 하는 연구가 얼마나 힘드냐고... 괜히 New England Journal of Medicine의 impact factor 가 50 을 넘어가겠어? - 흔히 아는 Science 나 Nature는 30 근처, 50을 넘는다는 것은... 더구나 리뷰가 아닌데... 전국체전에 우싸인 볼트가 출전했다고 보면 된다, 교내 백일장에 괴테가 나왔다거나 -. 토마스 쿤이 과학 혁명의 구조에서 말했듯이, 많은 과학분야가 경험적 지식의 축적에서부터 출발하고, 그 당시에는 체계화된 모델이 없이 중구난방인 것처럼, 생물학도 지금이 바로 딱 그 시기가 아닐까? 아직 central dogma를 제외하면 생물학 분야에는 아름다운 모델이 많이 부족한 것이 사실인데 - 맨날 context-dependent 래... >_<" - 이제 경험적 사실과, 단순한 나열에 불과할지라도 꼭 필요한 지식 쪼가리들이 쌓여 가고 있으니 반드시 강력한(elegant) 모델이 나올 것이다, 이 논문(The Hallmarks of Cancer)처럼.

   그리고, 아무 것도 없는 것보다는 어설프더라도 좀 잘못된 지도를 갖고 길을 찾아 나가는 것이 좋지 않던가. 중간중간 지도가 잘못되어 있는 것이 판명이 되면 생각을 고쳐 나가면서 나아가면 되는 것이겠지 (이건, 내가 심각한 회의에 빠진 것을 알고 계신 어떤 분이 나에게 들려 주신 말씀).

  
   그래서, 일주일간 게을리 하던 코딩(응?)을 다시 시작.

ps. 때마침 요런 논문도 나왔더군

Four stages of a scientific discipline; four types of scientist, Trends in Biochemical Sciences, 2009 vol.34, pp.217-223

토마스 쿤의 과학 혁명의 구조를 어느 정도 보완하는 부분이 있는 듯.
  1. 어떤 유전자를 갖고 있으면 어떤 병에 걸리기 쉽다더라, 같은 것. 요즘 병원에서 이런 검사를 좀 하는 것 같던데, 저 PLoS Genetics 논문에 나왔듯이, 그런 검사 받아 보았자 뾰족한 대안이 나올 수도 없으니, 그냥 운동 적당히 하고, 담배 끊고, 채식 위주의 식생활을 하는 것이 백번 나을 것이다, 그런 검사 받는 것보다는. [본문으로]
  2. 왜 의심을 하기 시작했냐 하면, 수학에서의 명확한 증명, 이런 것 없이 단지 말하고 싶은 거랑 결과랑 대충 맞으면 쓰는 것 같아 보였거든. [본문으로]