본문 바로가기

연구관련112

일중독일 것이라 생각하여 하던 코딩을 멈춘다. 대략 25~30대의 컴퓨터를 엮어서 사용 중이다. 그런데 중간에 연결이 끊기면 조치를 취해야 하므로 이것을 메일로 자동으로 보내는 프로그램을 작성 중이었다. 더불어 몇 가지 더 확인할 사항들을 집어 넣은 후, 이것들이 조건을 만족시키지 못하면 이 상황을 메일로 보내는 프로그램. 대략 30분에 한 번씩 확인해서 메일을 보내는 것. 잠시만이라도 컴퓨터가 놀고 있는 것을 보아 넘어 갈 수 없기도 했고, 내가 직접 확인하지 않을 때도 언제나 확인작업은 진행 중이라는 마음의 안도. 곧, 반대로 말하면, 내가 일을 하지 않고 쉬고 있어도 일이 진행되고 있다는 것을 확인할 수 없으면 생기는 불안감. 그러니까, 잠시라도 일이 진행되는 상황을 파악할 수 없으면 불안한 것. 중독인 것이다. 그래서, .. 2014. 10. 10.
연구 자원(DB 등) 개인적 사용 용도로 정리해 놓으려던 것을 공개용으로 전환하여 정리한다, 별 문제가 없으므로. 개별 설명은 최소한으로 하며 글을 읽는 사람은 전공자라 간주한다. 새로 알게 되는 내용에 따라 전체 구조가 수시로 변경될 수 있음을 미리 언급해 놓는다. 사견은 * 표시 뒤에 언급한다. 참고 문헌 링크 중 (PMC)는 누구나 읽을 수 있는 Open Access 에 대한 link 이다. Chemical DB 연번 이름 제공 설명 1 ChEMBL 현존하는 chemical DB 중 생물학적 관점에서 가장 방대한 두 DB 중 하나. 1 mysql 과 oracle의 dump 를 제공한다. 2 DrugBank 승인 받은 것과 실험중인 것 등, 약물에 관한 정보를 제공. 1 모든 구조를 단일 SDF 파일로 제공하며, 기타 정.. 2014. 9. 27.
100개가 넘는 core를 사용하는 요즘 매우 많은 컴퓨터를 사용해서 계산을 하고 있다. 물리적인 CPU의 개수가 아닌, hyper-threading으로 늘린 thread의 개수를 core라 하겠다. 즉, 요즘 보통 core 개수가 100개 이상을 갖고 작업을 하곤 했다. 우선 다른 연구실의 cluster 에 계정을 얻어서 돌렸다. 각 job이 어느 정도까지 실행되었는지 보기 위해 위와 같이 간단한 script를 만들어 확인해 보았다. 보통 200~300시간 정도가 걸려야 job 하나가 끝나는데, 이런 job이 200개 남짓. 이것을 한 번에 20개의 노드에 날렸고, 각 노드에서 core 4개를 점유해서 사용했다. 주말이나 연휴에 확인했을 때 다른 사람들이 node를 사용하고 있지 않으면 이 때는 대부분의 node를 이용했었다. 그러다 보니.... 2014. 8. 29.
SMILES 로 구조 파일 만들고 비교, 그림으로 나타내기 PDB에서 ligand 가 있는 것들에 대해서 SMILES 를 이용해 2D 혹은 3D 구조 파일로 만들고, 그림으로도 만든다. (구조 파일을 이용하여 그림을 그린 결과 비교는 이 글에 있다) 이것은 일을 할 때 찾아 보는 수고를 덜기 위해 개인적인 일을 기록한다. 명령어 조차도 할 때마다 찾아 보니 귀찮아서라도 이 곳에 사용했던 명령어를 적어 둔다, ㅋ. 결국은 SMILES, sdf file, mol2 file, 간의 상호 변환이 주된 문제이고, 이름으로 같은 chemical 인지를 matching 시키는 것에 있어 부정확한 것이 있으므로 구조로 비교까지 하는 것이 다른 한 작업. 주요하게 사용하는 프로그램은 Marvin 의 molconvert 와 OpenBabel. molconvert 는 연구용은 무료.. 2014. 4. 28.