- 고객 센터
1644-2827
월 - 금09:30 ~ 18:00점심시간12:00 ~ 13:00주말,공휴일휴무
![]() 맛보기 목록 수강신청하기 |
비환급일반
모바일
[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1
|
||
과정소개 | 본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다. |
||
학습목표 | NLTK 패키지를 이용한 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 영어를 분석할 수 있도록 목표한다 |
||
학습대상 | 영어 자연어 처리 및 NTLK 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 NLTK 패키지 및 관련 라이브러리를 배우고자 하는 자 |
||
학습방법 | 온라인 교육 ( PC + 모바일 ) | ||
강사소개 |
|
평가항목 | 진도율 | 과제 | 진행단계평가 | 최종평가 | 총점 |
---|---|---|---|---|---|
평가비율 | 100% | 0% | 0% | 0% | 100점 |
수료기준 | 80% 이상 | 0점 이상 | 0점 이상 | 0점 이상 | 80점 이상 |
평가방법 및 수료기준 |
* 진도율 80 이상 |
차시 | 차시명 |
---|---|
1차시 | 강의개요 및 권장 학습순서와 NLTK 설치하기 |
2차시 | corpus(말뭉치)란 무엇인가 |
3차시 | nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 |
4차시 | nltk gutenberg corpus 여러가지 값 출력 |
5차시 | nltk tokenization - sent_tokenize |
6차시 | word_tokeniz() 함수를 사용한 토큰화 vs gutenberg. words() 함수를 사용한 토큰화 비교 |
7차시 | 각 토큰당 평균 문자 수 |
8차시 | 브라운 코퍼스를 활용한 여러가지 메서드(1) |
9차시 | 브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 |
10차시 | FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 |
11차시 | 특정 단어의 빈도 수 체크 |
12차시 | 특정 단어의 빈도 수 체크 - list comprehension 사용 |
13차시 | 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 |
14차시 | 전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 |
15차시 | 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 |
16차시 | 브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 |
17차시 | cfd 출력시 pair로 구성해서 출력하기 |
18차시 | 브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 |
19차시 | n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 |
20차시 | nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 |
작성자 | 내용 |
---|---|
등록된 후기가 없습니다. |