반응형 프로그래밍109 Python PIP Install Numpy throws an error “ascii codec can't decode byte 0xe2” 오류 1. UnicodeDecodeError: 'ascii' codec can't decode byte 0xae in position 11 pip를 사용하시다가 이런 오류를 보실 수 있습니다. 제가 이 오류를 발견한 것은 제 노트북에서 pip를 사용하려고 할때 발생했습니다. 제가 찾아본 결과 UTF-8 즉 유니코드 읽어야 하는데 ascii로 되어있어 해독을 할 수 없다는 뜻입니다. 문제는 무엇일까요? 바로 다운로드 할 상위 폴더가 "한글" 로 되어있기 때문입니다. 제 데스크탑에 설치할 때는 아무 오류가 안떳는데 노트북의 관리자명을 무의식적으로 한글로 적어버려서 상위 폴더에 제 관리자 한글이 적혀있었습니다. (관리자 명을 바꿔도 폴더 명을 다 바꾸지 않는이상 오류가 계속 날겁니다.) 결국 포맷 후 영어로 변경하.. 2018. 12. 1. Python 한국어 형태소 분석기 모듈 konlpy 설치하기(jpype,wheel,numpy) 1. 설치하기 먼저 konlpy 를 사용하려고 합니다. konlpy는 명사를 분리 추출하기 위해 한국어 형태소 분석기 입니다. 만약 konlpy 를 다운 받지 않으면 이런 오류가 뜹니다 "jpype" 모듈이 없다고 뜨네요 http://konlpy.org/ko/latest/install/#id2 위의 사이트에 가서 Jpype와 konlpy의 정식 설치법을 볼 수 있습니다. 아래 설명처럼 저렇게 설치해야 한다고 써져 있는데 문제점이 있습니다. **주의 OS버전으로 맞추는게 아니라 Python버전으로 맞추어야 합니다. 앞에 2번 JDK 설치 하라고 하는데 JDK 버전을 맞춰주셔야 합니다. 64비트 or 32비트 (python 홈페이지 메인에 있는 것을 설치하시면 32bit를 다운받으셔야 합니다.) 안할경우 실.. 2018. 12. 1. Web Crawler(BeautifulSoup의 find, findAll 함수 사용해보기) 1. 이어서 크롤러의 꽃!! 웹 페이지를 분석하여 정보를 뽑아내는 일 먼저 naver 홈페이지에 있는 실시간 검색 순위를 가져오는 연습을 해봅시다. naver 홈페이지에서 F12 키를 누르고 Ctrl+F 로 실시간 검색중 하나를 찾아보면 아래와 같이 뜹니다. 실시간 급상승 검색어 아래에 이언주 이라고 뜹니다 위 1 이라고 적힌 숫자는 검색 순위를 뜻하고 아래는 검색어 순으로 되어있습니다. 참고로 은 html 태그로써 텍스트를 꾸며줄 수 있는 역할을 합니다. 여기서 꾸며줄 수 있는 class 는 css로 정의되어 있습니다. 위 찾은 정보를 통해서 간단한 Python 코드를 작성해 봅니다. 여기서 .findAll 이라는 함수를 통해서 정보를 찾습니다. 1 2 3 4 5 6 7 8 9 from urllib.r.. 2018. 12. 1. Web scraping with python(urlopen) 기초,연습 0. 들어가기 대학교 과제로 웹 크롤러를 만들면 교수님들이 좋아신다. 1. 기초 지난 시간에 설치까지 해보고 예제코드 까지 해보았습니다.url 입력을 받을 수 있는 urllib.request를 추가합니다. 1 2 3 4 5 6 from urllib.request import urlopen from bs4 import BeautifulSoup html=urlopen("http://naver.com") bsObj=BeautifulSoup(html.read(),"lxml"); print(bsObj.h1) cs 읽어드린 html 파일을 BeautifulSoup로 분석할 수 있도록 추가합니다. html 변수에 읽어드린 네이버 홈페이지를 BeautifulSoup로 변환한 후 print로 출력할때 h1의 태그로 된 .. 2018. 12. 1. 이전 1 ··· 22 23 24 25 26 27 28 다음 반응형