|
차시 |
강의 내용 |
시간 |
|
1 | 강의개요 및 권장 학습순서와 NLTK 설치하기 | 15분 |
|
2 | corpus(말뭉치)란 무엇인가 | 12분 |
|
3 | nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 | 21분 |
|
4 | nltk gutenberg corpus 여러가지 값 출력 | 18분 |
|
5 | nltk tokenization - sent_tokenize | 16분 |
|
6 | word_tokeniz() 함수를 사용한 토큰화 vs gutenberg. words() 함수를 사용한 토큰화 비교 | 21분 |
|
7 | 각 토큰당 평균 문자 수 | 12분 |
|
8 | 브라운 코퍼스를 활용한 여러가지 메서드(1) | 20분 |
|
9 | 브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 | 25분 |
|
10 | FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 | 22분 |
|
11 | 특정 단어의 빈도 수 체크 | 13분 |
|
12 | 특정 단어의 빈도 수 체크 - list comprehension 사용 | 13분 |
|
13 | 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 | 19분 |
|
14 | 전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 | 29분 |
|
15 | 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 | 16분 |
|
16 | 브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 | 30분 |
|
17 | cfd 출력시 pair로 구성해서 출력하기 | 12분 |
|
18 | 브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 | 10분 |
|
19 | n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 | 33분 |
|
20 | nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 | 18분 |
|