속도가 문제다.
여러 machine learning 기법으로 classification 을 할 수 있는데, 실제로 AUC of ROC 가 0.75 가 넘는다고 하더라도 plot을 그려 보면 과연 분리가 된 것인지 의아하다. practically 거의 의미가 없어 보인다. 실제로 진단기기로 승인을 받으려면 0.98 정도 되어야 한다고 한다 (한국에서). SVM이나 기타 방법들보다는, 나는, constraint adaptive differential evolution 을 이용해서 AUC 를 높이는 쪽으로 계속 밀어내는 식으로 진화를 시키는 방법을 택했는데, 역시나, 실행 시간이 꽤나 오래 걸린다. 어느 정도 예상은 했다. 그래서, virtual function 써서 추상화시키다가, 흠, 느릴 것 같아서, 역시나, 그냥 때려 박아서 구현, 실행시키니, 역시나 느리다. 내 이럴 줄 알았어... >.<"" 결과라도 좀 좋았으면 좋으려만 아무리 밀어도 0.8을 약간 넘는 정도다. 하긴, metastasis 를 non-metastasis 에서 분리시키는 것은 여태까지 0.75 정도 나온 것이 가장 잘 나온 것이니까... 아..., 난 실제로 진단에 사용될 수 있을만큼의 성능을 원했는데, 일단은 어려워 보인다. 몇 가지 fine tuning 을 할 것이 있으니 그것을 좀 해서 다시 확인해 보겠지만, 썩 좋은 결과가 나올 것 같지는 않다. 지금 이 방법으로 시도해 볼 것 두 가지가 더 있는데, 하나는 심장병으로 병원에 찾아 온 사람이 재발해서 다시 올 것인지 아닌지 하는 문제, 나머지 하나는 influenza virus 의 변이가 사람, 돼지, 조류 중 어느 쪽으로 잘 infection 될 수 있을 것인가, 하는 문제. 이 방법이 꽤 일반적인 것이라 여러 곳에 적용해 볼 수 있어서 좋다. 흠, 그래서 추상화시켜서 사용할려고 했던 것인데, 너무 오래 걸려... >.<"" cluster로 던져야 하나... 일단 수학적으로 조금이라도 최적화시킬 수 있는 부분은 최적화시킨 후, STL 대신 pointer 사용할 수 있는 부분은 전부 바꾸는 식으로 code level 에서 최적화한 다음 윈도우즈에서 openMP 를 써서 하는 식으로 테스트 해 보아야 겠다. 지금 내가 사용할 수 있는 윈도우즈 컴퓨터가 4개 되니 openMP 를 써서 얘네들 위에서 돌리면 굳이 cluster 로 돌릴 일은 없겠지만..., 영 안되면 던지거나 KISTI 의 수퍼컴퓨터를 사용하는 식으로 해야겠다.
어제는 막 퇴근하려던 찰나에, -70도씨 냉장고의 온도가 -40도까지 올라가는 바람에, dry ice 집어 넣고 2시까지 30분 간격으로 온도 확인하느라 늦게 갔는데, 오늘은 요 코딩 때문에 늦고 말았군. >.<""
여러 machine learning 기법으로 classification 을 할 수 있는데, 실제로 AUC of ROC 가 0.75 가 넘는다고 하더라도 plot을 그려 보면 과연 분리가 된 것인지 의아하다. practically 거의 의미가 없어 보인다. 실제로 진단기기로 승인을 받으려면 0.98 정도 되어야 한다고 한다 (한국에서). SVM이나 기타 방법들보다는, 나는, constraint adaptive differential evolution 을 이용해서 AUC 를 높이는 쪽으로 계속 밀어내는 식으로 진화를 시키는 방법을 택했는데, 역시나, 실행 시간이 꽤나 오래 걸린다. 어느 정도 예상은 했다. 그래서, virtual function 써서 추상화시키다가, 흠, 느릴 것 같아서, 역시나, 그냥 때려 박아서 구현, 실행시키니, 역시나 느리다. 내 이럴 줄 알았어... >.<"" 결과라도 좀 좋았으면 좋으려만 아무리 밀어도 0.8을 약간 넘는 정도다. 하긴, metastasis 를 non-metastasis 에서 분리시키는 것은 여태까지 0.75 정도 나온 것이 가장 잘 나온 것이니까... 아..., 난 실제로 진단에 사용될 수 있을만큼의 성능을 원했는데, 일단은 어려워 보인다. 몇 가지 fine tuning 을 할 것이 있으니 그것을 좀 해서 다시 확인해 보겠지만, 썩 좋은 결과가 나올 것 같지는 않다. 지금 이 방법으로 시도해 볼 것 두 가지가 더 있는데, 하나는 심장병으로 병원에 찾아 온 사람이 재발해서 다시 올 것인지 아닌지 하는 문제, 나머지 하나는 influenza virus 의 변이가 사람, 돼지, 조류 중 어느 쪽으로 잘 infection 될 수 있을 것인가, 하는 문제. 이 방법이 꽤 일반적인 것이라 여러 곳에 적용해 볼 수 있어서 좋다. 흠, 그래서 추상화시켜서 사용할려고 했던 것인데, 너무 오래 걸려... >.<"" cluster로 던져야 하나... 일단 수학적으로 조금이라도 최적화시킬 수 있는 부분은 최적화시킨 후, STL 대신 pointer 사용할 수 있는 부분은 전부 바꾸는 식으로 code level 에서 최적화한 다음 윈도우즈에서 openMP 를 써서 하는 식으로 테스트 해 보아야 겠다. 지금 내가 사용할 수 있는 윈도우즈 컴퓨터가 4개 되니 openMP 를 써서 얘네들 위에서 돌리면 굳이 cluster 로 돌릴 일은 없겠지만..., 영 안되면 던지거나 KISTI 의 수퍼컴퓨터를 사용하는 식으로 해야겠다.
어제는 막 퇴근하려던 찰나에, -70도씨 냉장고의 온도가 -40도까지 올라가는 바람에, dry ice 집어 넣고 2시까지 30분 간격으로 온도 확인하느라 늦게 갔는데, 오늘은 요 코딩 때문에 늦고 말았군. >.<""
'연구관련 > 연구생활' 카테고리의 다른 글
남의 소스 보기 >,<"" (0) | 2011.03.03 |
---|---|
에러가 안나서 불안해 (0) | 2011.01.19 |
생명연장의 꿈, CR (0) | 2011.01.05 |
매너리즘의 끝에서 (0) | 2010.10.14 |
R 사용하기 (0) | 2010.10.08 |