기본 콘텐츠로 건너뛰기

라벨이 블로그인 게시물 표시

얼룩소에서 글쓰기 4개월, 공부인 '중년의 위기' 극복 프로젝트

순수하게 글만 써서 소득을 얻은 것은 처음이다. 강의나 연구재단 과제 말고는 순수하게 글만 써서 돈을 쥐어 본 적이 거의 없다. 그러고 보니 가끔 청탁 원고를 쓴 기억이 있긴 하다. 그걸 제외하고 '내 의지를 가지고 내가 문제를 설정해서 쓴 글', 그러니까 블로그에 썼었을 글로 돈을 번 것이 처음이다. 얼룩소 글쓰기는 정말 충동적으로 갑작스럽게 시작하였다. 공부를 같이 하는 대학원생 친구가 블로그에 글 쓸 거면, 얼룩소에 쓰면 원고료를 받을 수 있다고 해서 시작한 것이다. 아, 생각해 보니, 글 생산자 모집 공고가 있었다. 그 공모에 참여해 보려는 것도 소소한 동기가 되었다. 물론 도전 결과는 탈락이었지만. 내가 쓸 수 있는 글과 그쪽에서 '시장성' 있게 볼 수 있는 글과는 거리가 있지 않았을까 싶다. 공부하는 자의 글쓰기라는 한계가 있으니까. 아니, 내가 가진 콘텐츠의 한계일지도, 아니, 내 사고방식의 한계일지도 모르겠다. 글로 돈을 버는 것은 사실 주 목표는 아니었다. 그러나 동기부여의 요소는 되었던 것 같다. 1타 2피의 부수적 이익으로. 최소 1주일에 글 1개는 써 보겠다는 생각을 했다. 지금까지는 잘 지켜온 것 같다. 논문 작업으로 바쁠 때는 1주일에 1개를 썼지만, 여유가 되면 2개, 많으면 3개를 쓰기도 했던 것 같다. 확인해 보니 12월 말 쯤에는 1주일에 6개까지 쓰기도 했다(크리스마스와 동지 축제 글이 길어졌기 때문이지만). 그렇게 4개월의 시간을 보냈다. 작성글 39건, 원고량은 원고지로 1,500매는 넘기지 않았을까 싶다. 어느 정도를 더 써야 책이 묶일 수 있을지는 아직 감이 없다. 버릴 거, 축약할 거, 새로 써야 할 거를 고려하면 3,000매 분량 정도면 계산이 서지 않을까 싶다. 주 목표는 원고를 모으는 것이었다. 책을 만들려고 생각했기 때문이다. 시간 나면 써야지라고 생각하니 원고가 잘 써지지 않았다. 소소한 동기부여 요소지만, 정기적으로 글을 쓸 수 있게 되니까 애초 책을 기획했을 때는 생각해 보지

블로그 이미지 백업 성공│티스토리 블로그 폐쇄 및 탈퇴

anthropo.tistory.com 을 최종적으로 없앴다. 방금 전에 이미지와 기타 첨부파일 백업을 완료했다. 텍스트 스크래핑 코드를 약간 응용해서 쉽게 코드를 짤 수 있었다. 오류도 꽤 줄일 수 있어서 텍스트 스크래핑보다는 적은 시간이 걸렸다. 파이썬 코딩 공부한 결과는 추후에 정리해 볼까 한다.  .   .   . 검열의 티스토리와는 이제 확실히 안녕.      

블로그 글 백업 1단계 성공

우여곡절 끝에 텍스트 백업을 마쳤다. 글을 비공개 상태로 스크랩핑 하는 방법이나 word 파일에 텍스트와 이미지를 모두 넣어 저장하는 방법 등을 고심했지만, 현재 나의 코딩 실력으로는 하세월이었다. 검색으로 찾아 볼 수 있는 코드와 유튜브 강의들을 참고해서 노가다로 만들었다. 약 790여개 * 의 아티클을 word 파일로 저장할 수 있었다.  * 위 이미지에서 'range' 항목이 709-907로 되어 있는데(이 의미는 url주소의 끝 숫자가 709에서 906까지 해당 페이지에 대해서 아래의 코드를 실행) 중간 중간에 예상하지 못한 error들을 다루며 코드를 바꿔가면서 했기 때문이다. 출발한 url의 숫자는 61번이었다. 중간에 결측치가 있기 때문에 846건의 아티클을 수집한 게 아니었다. 일정한 패턴의 url 주소를 바탕으로 해당 페이지의 내용을 구문분석해서 텍스트를 추출하고 그렇게 추출된 텍스트에서 제목, 시간 정보를 추출하여 가공하고, 본문 텍스트를 뽑아 제목과 본문을 워드 파일로 저장하게 한 코드다.  워드 파일명은 해당 게시물의 시간 정보+글 제목으로 만들었는데, 이 덕분에 가공이 더 필요했다. 제목에는 '<', '/', '?', '!', ':', '"' 등 컴퓨터 파일명에 쓸 수 없는 기호들이 담겨 있다. 이를 파일명에 쓸 수 있는 기호나 문자로 변환해 주거나 삭제할 필요가 있었다.  파일명을 그렇게 어렵게 정하지 않았다면 코드가 더 단순해졌겠지만, 파일에 담긴 글의 정보를 손쉽게 확인하게 하기 위해서 글제목으로 파일명을 삼기로 한 기준은 포기할 수 없었다   이 백업 데이터 중에서 무엇을 가공해서 쓸지는 또 한참 고민과 노가다가 남아 있다. 티스토리 블로그는 각 게시물의 이미지를 추출한 후에 모두 삭제할 예정이다. 조만간 티스토리와는 정말 안녕이다.

블로그 이사와 웹스크래핑 공부 (1)

코딩, 맛만 봤던 사람으로서 참 험난한 길을 걷고 있다. 티스토리의 만행에 열폭하여 '블로그 이사'를 선언했는데, 그 실현의 길은 어렵기만 하다. 50여건의 글을 수동으로 스크래핑을 해 보았지만 남은 게시물은 여전히 800건 가까이 된다. 학부 때부터 작성해 온 게시물을 네이버 블로그에서 티스토리를 거쳐 쌓아 놓았으니 결코 적지 않은 양이다. 그 중에 '재활용'의 의미가 있는 것이 얼마나 될지는 모르겠지만 지울 건 지우고 옮겨오려 한다. 급한 마음에 문과출신스럽게 접근한다면 '계속' 수동으로 copy & paste(복사/붙이기)를 해야 할 것이다. 한 두 번 해보았다. 15건 정도를 처리하는 데 1시간 정도는 걸렸던 것 같다. 정신 차리고 빠릿빠릿하면 40분 정도가 될지도 모르지만. 수동의 길은 이렇다. 1) 티스토리 로그인, 2) 글관리 도구로 들어가서, 3) 해당 글을 띄운 뒤, 4) 글 수정 모드에서 글과 제목을 copy해서, 5) Word * 에 붙여넣기하고, 6) 저장하되 7) 작성 시간과 제목으로 파일명을 부여해서 완료하고, 8) 해당 글을 과거 블로그에서 삭제하는 것으로 글의 백업을 할 수 있다. *  .txt를 쓸 수도 있지만 .docx를 쓰려 한 것은 이미지도 함께 copy&paste가 되어 좋으며, 용량도 15kb-500kb 정도로 적기 때문이다. 수동 스크래핑 방법 중 가장 편리한 것은 브라우저에서 pdf로 인쇄하는 것이긴 하다. 그 경우 용량은 2mb 내외가 된다. 새로운 블로그에 글을 재게재하는 것은 또 다른 일이 된다. word 파일에서 긁어다가 붙이는 건 text만 가능하고 이미지는 별도로 업로드 해야 하니. 이런 걸 프로그래밍해서 백업 파일을 만들고, 그 백업 파일을 자동으로 업로드할 수 있다면 좋을 것이다. 그러나 지금으로서는 백업은 자동으로 하고, 업로드는 선별과 수정 작업을 거쳐야 할 것 같다. 쓸만한 옛날 글을 재활용 한다고 할 때 어색한 문장이나 바뀐 생각을 반영해서

연이은 티스토리의 검열, 전화위복으로 만들 방법 고민

티스토리에서 '청소년 유해 정보'로 또 하나의 글을 블라인드 처리했다. 블라인드 처리된 글은 "오늘날 사드의 문제작 《소돔의 120일》을 읽는다는 것은"이라는 글이었다. '소돔의 120'의 개략적인 내용과 그 의미를 정리해 본 글인데, 이 글에 만레이의 '사드의 기념비(Monument to D.A.F. de Sade, 1933)와 이 책의 영화화 버전인 '살로 소돔의 120일'의 포스터가 있었다. 사드 책의 내용을 다룬다는 점, 그리고 만 레이 작품과 살로 포스터가 실려있다는 점 때문에 '청소년 유해 정보'로 판단을 받은 것 같다. 그렇게 추정할 수밖에 없는 것은 티스토리는 해당 조치 통보 메일에 관련 정보를 전혀 제공하지 않기 때문이다. 선정적인 작품이긴 하지만 엄연히 문학 작품에 대한 이야기마저 '유해'하니 하지 마라. 이런 식으로 판단하고 '영구적으로 이용 제한 되니 조심해' 이렇게 경고하니 어처구니가 없다. 긴 시간 해당 블로그에 여러 글을 작성해 왔는데, 그 글들을 인질 잡힌 기분이 들었다. 응당 이의제기를 했다. 문학작품, 예술작품 이야기한 것을 어떤 기준으로 유해정보로 판단하느냐, 문제가 있다고 하면 시정할 수 있는 기회를 주고 제재를 가해야 할 거 아니냐 이런 식으로 이의제기를 했다.  돌아올 답이 뻔할 것은 알고 있었지만. 이의제기를 해서 이 업체에서 받아들여진 것을 내가 경험한 적이 없으니. 답변도 이제까지 아주 메뉴얼에 입각한 형식적인 답변(거의 복붙 같은)만을 받아왔기 때문에, 인간적인 답변을 요구하기도 했다. 카카오의 이런 판단에 대해서는 동의하기 어렵다. 인간성의 어두운 면을 실험한 내용에 대해서 이야기를 할 수 없게 막아 놓는다니. 청소년 유해 정보를 막기 위한다는 미명하에 그저 정부의 규제에서 자유롭자 하는 기업의 대처 밖에는 되지 않는다고 생각한다. 청소년들이 사드의 '소돔의 120일'이나 그 영화 '