본문 바로가기

연구관련

(112)
민감도와 특이도 (sensitivity and specificity) 진단의 관점에서 민감도(sensitivity)는 질병이 있는 사람을 얼마나 잘 찾아 내는가에 대한 값이고 특이도(specificity)는 정상을 얼마나 잘 찾아 내는가에 대한 값이다. 즉, 민감도는 질병이 있는 사람을 질병이라고 진단하는 비율이고, 특이도는 정상을 정상이라고 진단하는 비율이다. 일반적인 관점에서 민감도는 실제로 양성인 개체에 대하여 양성이라고 판단하는 비율이고 특이도는 실제로 음성인 개체에 대하여 음성이라고 판단하는 비율이다. 이 글은 진단의 관점에서 주로 설명한다. 진단의 경우 '질병이 있는 개체'를 양성으로 판단하며, 따라서, 다음 글에서 양성은 질병군을 의미한다. 그러나 민감도 및 특이도, 또한 그에 따른 많은 개념들은 양성/음성과 같이 교집합이 없는 두 집합에 대하여 일반화 할 수..
이런 거 하지 말라고 정규 표현식 있는 거다 뭐냐면, 문자열 처리를, 진리의 C++로 해보자. 위 코드는 value가 한 줄에 있는 xml 형식을 처리하기 위한 코드이다. 어차피 xml 파일 자체도 전부 내가 만들기 때문에 이 경우만을 고려하면 되어서 이렇게 했다. 위는... 만약 정규 표현식을 쓴다면, (.*?) 정도로 하겠지. 이 한 줄이면 되는 것을 C++로, 그것도 예외 처리도 별로 하지 않고 하면 위처럼 지저분해지는 거다, >.
아오, visual studio 는 왜 하위호환성이 없냐고... 하여튼, 그러니까 5년 10년된 걸로 계속 개발을 하는 거 아니냐고... VS2010 으로 개발을 쭉 해 오다, 얼마 전, 이제 나온지도 몇 년 됐으니까 괜찮겠지, 하고 2013으로 올려 봤더만 하여튼 오만가지 문제가 튀어 나온다. 게다가 windows 10 으로 올리라고 계속 뜨는 것을 없앨 수가 없어서 결국 windows 까지 7 에서 10 으로 올렸더니, 이게 도대체 어디서부터 문제가 발생한 것인지 찾을 수가 없고, 인터넷 검색을 해도 visual studio 2013 에 관해선 내가 겪는 문제에 대한 해답이 별로 없고 대부분은 vs2010 을 기준으로 한 답변들이다. windows 10 을 올리면서도 이것들이 멋대로 사용자의 성향을 가정해서 설정해 놓은 부분들이 마음에 안 드는 것이 한두가지가 아..
chemical descriptor (aaaC 등등) chemical의 molecular weight, ring number, 각 atom 의 수, charge 등등의 특성을 chemical descriptor라 하며, 물리/화학적 성질 이외에 구조의 기하학적 특성 등 매우 많은 descriptor 가 존재한다. 이에 관한 괜찮은 자료들. 찾고 찾아 들어 간 논문 중에 Electrotopological State Indices for Atom Types: A Novel Combination of Electronic, Topological, and Valence State Information, Lowell H. Hall, Lemont B. Kier, J. Chem. Inf. Comput. Sci., 1995, 35 (6), pp 1039–1045 DOI: ..
HuEx-1_0-st-v1 cdf 처리 문제 HuEx-1_0-st-v1 은 HuEx-1_0-st-v2 의 cdf 이용하면 된다. 구글 검색어:HuEx-1_0-st-v2 HuEx-1_0-st-v1 http://www.aroma-project.org/chipTypes/HuEx-1_0-st-v2/ Note II: Older CEL files for this chip type, may be reported to have chip type 'HuEx-1_0-st-v1'. This chip is slightly different from the 'HuEx-1_0-st-v2' chip. According to Affymetrix support, the difference is only in the control probes; "There is only a mi..
드뎌! 서버 미러링 작업중. 약간 병적으로 집착하는 것은, ㅋㅋ, 데이터가 날아가지 않을까, 하는 것. 왜 그런지 정확히는 모르겠지만 지금까지 HDD 가 망가진 경우가 많다. bad sector 같은 것이 생겨서 못 쓰게 된 HDD 만 모아 놓아도 열 개는 족히 되리라. 그래서 항상 데이터의 백업에 집착하곤 했었지, ㅋㅋ. 그래서 dropbox 가 나왔을 때도 꽤 이른 시기부터 사용했었다. 유료로 사용한지도 꽤 되었지. 아, 물론, 아이 클라우드 역시 한 달에 천원 더 내고 50GB 사용 중. 내 생각은 항상 그랬다, 핸드폰이나 컴퓨터같은 딱딱한 기계 덩어리가 문제가 아니라 그 안에 들어 있는 데이터가 문제다, 따라서 기계가 망가지는 것은 관심 없고 데이터가 날아 가는 것이 문제다! 뭐... 물론 기계가 망가져도 가슴이 좀 아프지만..
노가다에 의한 철야? 오래간만이다, 이 시간까지 있는 것이. 물론 집에 들어 간다고 해도 보통 2시 정도에 자기는 하는데, 연구실에 이 시간까지 있던 경우는 꽤 오랜만이다. 아무래도 모니터를 두 개 사용하고, 키보드를 사용하는 것이 랩탑을 이용하는 것보다 편하다보니 뭔가 마우스와 키보드를 오가며 해야 할 일이 있을 경우에는 연구실에 늦게까지 있게 되곤 한다. 코딩이라면야 방에 들어가서 침대에 누워서도 할 수 있으니 일찍 - 그래봐야 10시에서 12시 정도지만 - 들어 가곤 하는데 말이다. 왠만한 것들은 코딩을 해서 해결하려 하지만, 결코 코딩으로 해결할 수 없는 경우들이 있다. 이런 경우 엄청난 노가다를 며칠이고 하곤 한다. 어쩔 수 없지, ㅋ. 엑셀을 매우 많이 한다거나, 하여튼 그런 것. 지금은 한문으로 된 문서를 분석하..
autodock vina를 직접 compile 해서 사용하기 protein-chemical binding affinity 를 계산하는 프로그램인 autodock vina 를 컴파일 해보자. 컴파일을 하는 이유는 실제로 이 프로그램을 실행시킬 컴퓨터에서 컴파일을 해서 사용하면 제공되는 실행 파일을 이용하는 것보다 속도가 좀 더 빠르기 때문이다. 정확한 test 는 아니지만 linux > windows 8 > windows 7 순서로 속도가 빠른 것을 확인할 수 있었고, 각 경우 언제나 직접 컴파일 한 실행 파일이 속도가 더 빠르게 나왔다. 위 결과는 컴퓨터가 아주 안좋은 경우부터 아주 좋은 경우까지 모두 해당된다. 리눅스에서의 컴파일 윈도우즈에서의 컴파일 리눅스에서의 컴파일 우선 결론적으로 정리된 절차는 다음과 같다. 32bit 운영체제(OS)에서 한 것이기 때문에..