2013-08-28

티스토리 백업 파일(TTXML)에서 첨부파일 추출

얼마 전 kkoyee.com 댓글을 확인해보니 해당 글의 이미지 파일 하나가 사라져 있었습니다.


작성하고 시간이 꽤 흐른 글이라서 그냥 둘까도 고민했지만 복구하기로 마음을 먹었습니다. 문제는 복구 방법이었습니다. 전체 글을 백업한 후 TTXML파일을 편집할까도 생각했지만 이미 티스토리 데이터 복원 기능은 없어졌습니다. ( 참조 : http://notice.tistory.com/2119 ) 다음으로 생각한 방법이 TTXML에서 이미지 파일을 추출하고 추출한 파일을 다시 업로드 하는 것이었습니다. 문제는 TTXML에서 이미지 파일을 추출하는 방법이었습니다.

구글 검색을 해서 찾은 TTXMLParser ( 참조 : http://kuna.tistory.com/1092 ) 를 이용하려고 했지만 불행히도 제 컴퓨터에서는 제대로 작동하지 않았습니다. 이전에 백업한 파일과 이번에 백업한 파일을 열어보니 이렇습니다.



텍스트큐브(태터툴즈)에서 이미지 파일을 저장하는 파일명 규칙(영문자두개+숫자세개)이 백업한 파일을 티스토리로 복구하면서 다른 파일명 규칙(다수의 영문자와 숫자)으로 변경돼 있습니다. 문제는 유독 누락된 이미지 파일만이 dn348.jpg라는 태터툴즈 식의 파일명을 하고 있었습니다. 아마도 어떤 이유로 티스토리로 파일을 복원하면서 사라진 것으로 보입니다. 문제는 복구입니다. 이전에 백업한 TTXML파일에서 dn348으로 검색을 했습니다.


이런 검색 결과를 얻을 수 있었습니다. 아마도 원본 파일명은 'TWCI_2007_6_17_0_57_33.jpg'이고 아래로 쭉 이어지는 문자열이 파일의 내용인 것 같습니다. 결국은 다시 이래저래 구글링을 시작했습니다. 그리고 첨부 파일을 base64형식으로 저장한다는 것을 알 수 있었습니다. ( 참조 : http://blog.peremen.name/entry/author/admin/page/160/ )

http://www.motobit.com/util/base64-decoder-encoder.asp에서 <content>와 </content>사이의 괴상한 문자열을 복사해서 넣고 디코드를 시도해 봤습니다. 그리고 원하던 이미지를 복원할 수 있었습니다.


글의 전후 관계로 비추어 볼때 사라진 이미지 파일이 맞습니다. 프로그래밍에 대한 지식이 있었다면 쉽게 해결했겠지만 프로그램 제작에 대해서 아는 것이 없다보니 남은 것은 시행착오 뿐이었습니다. 어쨌든 무사히 파일을 복구할 수 있어서 다행입니다.

댓글 없음: