기본 콘텐츠로 건너뛰기

nltk 라이브러리 사용 문제-pip install invalid syntax, 환경 변수 path 설정

야메로 python을 배우다보니 기본적인 부분에서 문제가 발생하면 해결이 참 난감하다. python 3.9.x로 작업을 하고 있었는데, nltk를 import해서 word_tokenize 함수를 사용하려 할 때 문제가 발생했다.

오류가 발생할 때 문제해결에 집중해서 관련 문제가 구체적으로 무엇이었는지 찍어 놓지를 않아서 구체적인 오류 코드를 확인하지 못했다.

다만 python 3.9에 아나콘다3를 설치하고 Pycharm을 주로 사용했는데, nltk의 word_tokenize()를 쓰려고 할 때 문제가 발생했다.

문제해결 방법으로 일반적으로 추천되는 것이

nltk가 잘 인스톨 되었는지 체크하고 문제가 있다면 nltk.download()로 해결할 수 있다는 것이었다.

가령 저런 정보를 확인하고 시도해 보았다. 그러나 어떻게 된 일인지 cmd 창에서 'python'이 먹히지 않았고 python 창을 띄워서 작업하면 다음과 같은 결과가 나왔다.

nltk 라이브러리가 없어서 문제라 생각해서 pip install nltk를 입력했는데, invalid syntax 오류만 떴다. 위에서 말한 대로 'nltk_data' 폴더를 C:에 만들고 해당 패키지를 수동으로 다운로드해서 시도해 봤지만 오류는 해결되지 않았다. 

어딘가에서는 [시스템 속성>고급>환경변수>path]에서 'C:\Python'과 'C:\Python\Scripts'를 추가하면 문제가 해결될 것이라 해서 그렇게 해 봤는데 역시 문제는 해결되지 않았다.

'nltk 설치 오류' 등을 찾다가 아래와 같은 설명을 만날 수 있었다.

그래서 python 3.9.x를 지우고 3.7.9를 다시 설치했다.

그러나 invalid syntax 문제는 해결되지 않았다. 계속 찾아보니 경로의 문제라는 지적이 있었다. 앞에서도 봤던 것이라 시큰둥 했는데 경로 주소가 앞서 제시한 것과는 달랐다.

C:\Users\[user_com_name]\AppData\Local\Programs\Python\Python37\
C:\Users\[user_com_name]\AppData\Local\Programs\Python\Python37\Scripts\

이걸 넣어주라는 것이었다. 이렇게 하니 pip install 명령도 적용이 되었고, nltk 라이브러리 설치도 문제가 없었다.

이것저것 찾아보니 이 환경 변수 추가 조치는 '기본'인 것 같다. 이 기본기를 몰라서 삽질 오지게 했다. 3.9의 호환성 이슈보다는 환경 변수 설정 문제였던 것 같다.

일단 pip이 먹히지 않으면 환경 변수부터 손보고 라이브러리 설치 및 호환성 문제를 따져야 할 것 같다. 개고생 하며 하나 배웠다.

코랩colab에서 작업할 때 nltk를 설치하고 punkt가 없을 시에 error가 생긴다. nltk.download('punkt')를 실행하면 문제를 해결할 수 있다. 그러면 word_tokenize()를 적용할 수 있게 된다. 

기타 여러가지 패키지를 요구할 수 있는데, 그 경우에도 에러 코드에 설치 필요한 패키지를 알려 준다. 간편하게 대응할 수 있는 방법은 nltk.download('popular')이다. 인기있는 패키지를 쫙 깔아 준다.

댓글

이 블로그의 인기 게시물

제임스 카메론 감독과 예수 가족의 무덤, '예수 신화'에 이야기를 더하다

 얼룩소에 2023년 8월 2일에 쓴 글입니다. *  *  * 최근에 『예수의 무덤: 역사를 뒤집을 고고학 최대의 발견』(2007)이란 책을 보게 되었습니다. 『예수의 무덤』의 표지(출처: 교보문고) 원제는 The Jesus Family Tomb: The Discovery, the Investigation, and the Evidence That Could Change History (예수 가족의 무덤: 역사를 바꿀 수 있는 발견, 조사, 그리고 증거, 2007)입니다. 이 책을 보고 '제임스 카메론'이 등장할 것을 알기는 어렵지요. 관련 논란을 미리 알았더라면, 그리 놀라지는 않았을 것 같습니다. 책을 펼치면 '추천의 글'이 있습니다. 이 글을 쓴 사람이 제임스 카메론(캐머런)이었습니다. 『예수의 무덤』 17쪽, '추천의 글' 글쓴이 그런데 이 책의 문제 의식은 상당히 인상적입니다. 역사학자, 성서학자의 '예수의 실존'에 관한 일반론에 대한 반박을 할 수 있는 결정적인 물리적 증거(예수 가족의 무덤)가 심차 자코보비치(Simcha Jacobovici)와 찰스 펠리그리노(Charles R. Pellegrino)에 의해서 발견되었다는 것입니다.  요즘 많은 전문가들이 예수가 실제로 존재하지 않았다고 주장하고는 한다. 이교도들의 신, 죽음과 부활의 신화, 1세기경 유대인들의 메시아 전통 등이 결합되어 조작된 존재로, 예수 역시 그리스 신화의 제우스처럼 역사적 실존 인물이 아니라는 주장이다. ... 그리고 대부분의 학자가 크리스마스도 동지를 축하하는 이교도의 전통을 받아들인 것으로 해석한다. 동정녀 잉태와 부활 등 예수의 이야기에서 기본적인 틀을 이루는 많은 부분이 예수의 존재보다 적게는 수백 년을 앞서고 있기 때문에, 예수가 실존 인물이 아니라 어떤 특별한 이유로 조작된 신화적 인물이라는 주장이 설득력 있게 들린다. 예수 그리스도가 실제로 이 땅에서 살았다는 물리적 증거가 하나도 없기 때문에 ...

태백산, 산당, 서낭당 그리고 사람들┃답사 후기

[2017년 6월에 태백산 일대의 답사를 다녀와서 쓴 글입니다. 답사는 6월 3일부터 6월 4일까지. 후기 작성일 2017. 6. 7.] · · · 태백산에 다녀왔다. 천제단, https://www.khan.co.kr/local/Gangwon/article/202204281434001#c2b 난 답사를 싫어한다. 주위 사람들은 다 알고 있다. '왜 가야 하나'에 적절한 답을 가져본 적이 없다. 학부 때는 '학술'을 가장한 MT같은 것이니 어쩔 수 없다 싶었는데, 대학원에 들어와서는 그마저도 관심이 시들해졌다. '학'은 사라지고 '술'을 위해서 가는 것이라면 또 굳이 갈 이유가 있을까 싶기도 했다. (실제 답사가 다 그런 것은 아니다. 내가 답사에서 무언가 발견할 수 없었기 때문에 그렇게 느꼈던 것 같다) 그런데 박사수료 후부터 조금 달라졌다. 이제 '그곳'에 가면 이야기가 보이기 시작한다. 그것도 재미가 있다. 왜 그런가 싶었는데, 역시 수준 높은 연구자들과 함께 가서 그런 것 같다. 혼자 갔다면 도저히 그곳의 이야기, 그곳 사람들의 이야기를 듣지 못했을 터다. ('자기 문제의식'이 명료화 되었다는 점도 중요한 것 같기는 하다) '산악신앙'은 상식적으로는 '원시신앙'으로 학술적으로는 자연신앙 내지는 마을신앙과 관련된 민속신앙으로 이야기된다. 고도의 신학적 이야기, 그래서 인생의 의미를 음미하는 따위의 것이 담겨있지 않다. 그래서 상당히 빈곤하게 이해된다. 그런데 이번에 태백산 답사를 가서, 거기에 '인간'을 들여다 보는 '어떤 창'이 있다는 것을 새삼스럽게 확인하게 되었다. 산은 '신성한 곳'이다 태백산 같이 높은 산, 주변 지역의 '중심'이 되는 산은 특히 그렇다. 그런 산들은 일단 직접적으로 인간에게 '위험'하다. 맹수로부터 목숨을 위협 받을 수 있는 곳이다. 높...

우리 뇌의 '미래 보상 감지기'로서의 세로토닌?!

최근 오타와 대학교 연구팀이 세로토닌 뉴런이 우리 뇌에서 어떤 역할을 하는지에 관한 흥미로운 연구 결과를 발표했다. 이 연구는 우리가 일상에서 수많은 결정을 내릴 때 세로토닌이 어떻게 작용하는지에 대한 새로운 시각을 제시한다. 세로토닌의 새로운 역할: 미래 가치 예측자 세로토닌(serotonin)은 흔히 '행복 호르몬' 또는 '기분 좋게 만드는 화학물질'로 알려져 있다. 많은 항우울제가 이 세로토닌 시스템을 대상으로 하는 이유도 여기에 있다. 그러나 세로토닌의 정확한 역할은 그동안 과학자들에게 수수께끼였다. 이번 연구에서 밝혀진 중요한 발견은 세로토닌 뉴런이 단순히 즐거움이나 고통에 반응하는 것이 아니라, '예상 가치(prospective value)'라는 신호를 보낸다는 것이다. 이는 가까운 미래가 얼마나 좋을지를 뇌에 알려주는 일종의 예측 신호이다. 강화 학습 이론과 뇌 연구의 만남 연구팀은 '강화 학습 이론(reinforcement learning theory)'과 뇌의 세로토닌이 풍부한 지역인 '등쪽 솔기핵(dorsal raphe nucleus)'에서 얻은 신경 기록을 결합했다. 강화 학습 이론은 인공지능 분야에서도 사용되는 개념으로, 행동의 결과를 바탕으로 학습하는 방식을 설명한다. 쉽게 말해, 좋은 결과를 가져온 행동은 반복하고, 나쁜 결과를 가져온 행동은 피하게 되는 학습 방식이다. 등쪽 솔기핵은 뇌간의 한 부분으로, 세로토닌을 생산하는 뉴런이 많이 모여 있는 곳이다. 이 지역은 우리의 기분, 수면, 식욕 등 다양한 기능에 관여하고 있다. 의외의 보상에 더 강하게 반응하는 세로토닌 뉴런 연구에 따르면, 세로토닌 뉴런은 특히 '예상치 못한 보상(unexpected rewards)'에 가장 강하게 반응한다. 예를 들어, 갑자기 길에서 돈을 발견했을 때 우리 뇌의 세로토닌 뉴런은 평소보다 더 활발하게 활동한다. 이는 세로토닌이 단순히 현재의 즐거움이나...