|
차시 |
강의 내용 |
시간 |
|
1 | KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2) | 24분 |
|
2 | KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3) | 17분 |
|
3 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1) | 25분 |
|
4 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2) | 21분 |
|
5 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3) | 9분 |
|
6 | 단어주머니란 무엇인가 - Bag of words | 25분 |
|
7 | 빈도 수 기반의 핵심어 추출 | 20분 |
|
8 | TF-IDF 어휘 빈도 문서 역빈도 | 10분 |
|
9 | 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리 | 19분 |
|
10 | 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer | 13분 |
|
11 | Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리 | 12분 |
|
12 | Bag of words 구현하기(4) - stopwords, punctuation 제거 | 14분 |
|
13 | 사이킷런 BoW 구현1 | 27분 |
|
14 | 사이킷런 BoW 구현2 - Count Vector 수치화 | 19분 |
|
15 | 사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기 | 9분 |
|
16 | CountVectorizer 파라미터 옵션(1) - max_df, min_df | 27분 |
|
17 | CountVectorizer 파라미터 옵션(2) - max_features, stop_words | 32분 |
|
18 | CountVectorizer 파라미터 옵션(3) - ngram_range | 24분 |
|
19 | TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1) | 27분 |
|
20 | TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2) | 19분 |
|