본문 바로가기
컴퓨터/자질구레 팁

dropbox : 자료의 분산

by adnoctum 2010. 9. 25.

   중요한 자료는 여러 곳에 동시에 보관해야하는 것은 철칙이다. 이와 같은 상황에서 사용하기 편리한 소프트웨어(서비스)가 바로 dropbox 이다. 사용 방법이 매우 직관적이고, 개인적으로 리눅스에서도 윈도우즈에서와 완전히 동일한 방식으로 사용 가능하기 때문에 더욱 좋아한다.

   나는 가지고 다니는 노트북이 그 자리에서 박살이 나도 크게 상관이 없다[각주:1]. 왜냐 하면 그 안에 있는 중요한 파일들은 거의 언제나 다른 컴퓨터에 그대로 있기 때문이다. 이와 같은 일을 가능하게 해주는 것 중 하나가 dropbox 이다.

   dropbox 설명 dropbox는 지정해 놓은 folder가 그대로 dropbox 서버로 복사가 된다. 그리고 다른 컴퓨터에서 dropbox를 설치하고 로그인을 하면 내가 다른 컴퓨터에서 지정해 놓았던 폴더가 그 컴퓨터로 그대로 복사가 된다. 즉, dropbox 에 백업시키기 위해 지정해 놓은 폴더가 dropbox를 사용하는 모든 폴더에서 동기화(synchronization)된다. 다시 말해, 정확히 같은 폴더가 여러 컴퓨터에 동시에 생성되고, 인터넷이 연결이 되면 그 어느 곳에서 수정한 내용이더라도 서버를 통해 모든 컴퓨터의 폴더에 그대로 적용이 된다. 1번 컴퓨터에서 한 파일을 생성했으면 dropbox 를 설치한 2번, 3번 컴퓨터에도 그 파일이 저절로 생성이 된다. 만약 인터넷을 끊어 놓은 상태로 1번 컴퓨터와 2번 컴퓨터에서 같은 파일을 서로 다르게 수정을 하면 filename_(1), filename_(2) 이런 식으로 파일 이름 끝에 version 이 붙는 식으로 파일이 하나 더 생성된다.


위처럼 dropbox로 동기화 시킬 폴더를 지정해 놓으면, dropbox가 설치된 모든 컴퓨터에 저 폴더와 하위 폴더가 항상 같은 내용을 갖게 된다.



   기본 용량은 2GB 이고, 추가 비용을 지불하면 용량을 늘릴 수 있다. 또한 인터넷으로 접속이 가능하기 때문에 만약 dropbox를 설치하지 않은 컴퓨터에서 dropbox로 sync 시켜 놓은 폴더에 있는 파일을 사용해야 한다면 그냥 dropbox 사이트에 가서 로그인을 하면 그 파일을 사용할 수 있다. 또한 인터넷으로 접속을 해서 보면 각 파일이 수정되었던 그 이전 파일들까지 확인을 할 수 있다(revision history).

   파일의 동기화가 어떻게 이루어지는지는 자세히 모르겠으나, 아마도 rsync 와 비슷한 방식을 취할 것으로 예상된다. 파일 내용이 변화가 되었는지를 서버에 있는 내용과 local 컴퓨터에 있는 내용을 비교하여 변화가 생긴 파일들만 지속적으로 update 한다. 수정된 시간을 사용하거나 하겠지.

  


dropbox로 동기화 될 폴더에 있는 파일을 열어서 수정을 하게 되면 위와 같이 tray icon의 둥근 모양의 화살표가 계속 움직이는데, 이것은 그 파일의 수정이 끝나기를 기다리고 있다는 뜻이라고 한다. 따라서 dropbox 서버로의 파일전송은 파일 수정이 끝난 이후에 한 번만 이루어진다고 한다. 난 계속 전송하는 것인줄 알고 항상 dropbox 를 끄고 파일을 수정했었는데 굳이 그럴 필요는 없을 듯.

아이콘이 계속 움직이는데, 계속 sync가 일어나고 있는 것이냐고 물어 봤더니 위와 같은 메일이 왔다.



  



    dropbox 는 클라우드 컴퓨팅의 한 예이다. 즉, 우리는 dropbox 서버가 물리적으로 어느 곳에 위치하는지 신경 쓸 필요 없다. 그냥 구름 뒤 어딘가, 산타페나 워싱턴, 런던이나 어딘가에 있겠지. 인터넷 서점 아마존의 수익 중 상당수는 이러한 저장공간서비스로부터 나온다고 한다.



   데이터 분산의 중요성 많은 정보가 네트웍크에 물려 자유로운 이동이 가능해 진 것과 대비하여 인간의 사고는 아직 그만큼 자유로운 이동이 되지는 않고 있는데, 특히 자신의 desk top에만 자료를 저장하고 있는 것이 그 한 예가 되겠다. 문제는 언제나 생길 수 있다. 갑자기 하드 디스크가 맛이 가서 자료를 복구하지 못할 수도 있고, 깜빡하고 데이터 영역까지 포멧을 할 수도 있다. 난 이 둘을 모두 경험했기 때문에 데이터 분산 및 백업에 더욱 공을 들인다. 경험한 후에야 비로소 그 필요성을 인식한다는 것은 참으로 오래된 인간의 어리석은 면 중에 하나일 것이다. 가장 간단하게 말해서, 어느 컴퓨터도 안전하지 않다. 복잡한 기계일수록 오류의 가능성이 증가한다는 진리에 비추어, 이런 상황에서 우리가 할 수 있는 유일한 방법은 중복분산(redundancy) 뿐이다. 컴퓨터로 먹고 사는 사람들도 데이터를 분산하는 방법 말고 딱히 뾰족한 방법이 없는 것에서 알 수 있듯이 우리는 중요한 데이터를 반드시 분산시켜 놓아야 유실을 미연에 방지할 수 있다. 심지어 이런 상황에 대비하여 큰 회사에서는 자료를 물리적으로 매우 멀리 떨어진 둘 이상의 장소에 중복 보관한다. 서울과 부산, 과 같이. 한 곳에서 천재지변으로 데이터 센터가 망가져도 다른 한 곳에서 지속적이고 끊임없이(seamless) 서비스 할 수 있도록. 이제 서버는 rsync를 통해서 중복시키고, 너무 커서 그렇게 할 수 없는 개인자료는 dropbox를 통해 중복시키고 있다.

  1. 물론 노트북이 아깝긴 하지... 하지만 데이터를 잃어 본 사람은 노트북 박살나는 것보다 데이터를 잃는 것이 더 큰 슬픔이라는 것을 알 것이다. [본문으로]