Sentimentation 01

2022. 4. 14. 10:15AI study

1.KoNLPy 설치 :  KoNLPy는 한국어의 형태소 분석과 품사 태깅을 위한 다양한 모듈을 제공

> pip install konlpy

2. 여기서는 트위터 분석용으로 만들어진 Okt() 클래스를 활용하고자함

- 각 문장에서 형태소를 끄집어 낸 후, 그 형태소가 몇 번 사용되었는지를 세고, 그걸 array 형태로 저장하고자함

=> 이 과정을 쉽게 해주는 모듈 scikit-learn의 함수 CountVectorizer가 존재함