|
차시 |
강의 내용 |
시간 |
|
1 | 파이썬 코드로 n-gram 구현하기 | 30분 |
|
2 | nltk stopwords를 활용한 불용어 제거하기(1) | 20분 |
|
3 | nltk stopwords를 활용한 불용어 제거하기(2) | 16분 |
|
4 | nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항 | 15분 |
|
5 | 한국어 불용어 제거하기 | 11분 |
|
6 | Stemming(스테밍)이란 무엇이고 왜 필요한가 | 31분 |
|
7 | Stemmer를 사용한 어간 추출 | 27분 |
|
8 | PorterStemmer vs LancasterStemmer 어간 추출 비교 | 16분 |
|
9 | 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 | 11분 |
|
10 | 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습 | 22분 |
|
11 | 주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습 | 8분 |
|
12 | lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법 | 23분 |
|
13 | WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기 | 22분 |
|
14 | WordNetLemmatizer에서 제대로 처리하지 못하는 단어들 | 5분 |
|
15 | 품사 정보를 제공하여 기본형(표제어) 추출 | 13분 |
|
16 | 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1) | 26분 |
|
17 | 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2) | 22분 |
|
18 | 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3) | 30분 |
|
19 | 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4) | 12분 |
|
20 | 구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기 | 13분 |
|