강의 썸네일

맛보기

목록


수강신청하기

비환급일반
모바일
[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1
학습분량
20차시
NCS분류
02020302(사무행정)
교육기간
30일 (6시간)
복습기간
7일
환급유형
비환급일반
 
 
교육비용
₩ 40,000
결제금액
₩ 40,000

과정소개

과정소개

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

학습목표

NLTK 패키지를 이용한 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 영어를 분석할 수 있도록 목표한다

학습대상

영어 자연어 처리 및 NTLK 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 NLTK 패키지 및 관련 라이브러리를 배우고자 하는 자

학습방법 온라인 교육 ( PC + 모바일 )
강사소개
등록된 강사정보가 없습니다.

평가기준

평가항목 진도율 과제 진행단계평가 최종평가 총점
평가비율 100% 0% 0% 0% 100점
수료기준 80% 이상 0점 이상 0점 이상 0점 이상 80점 이상

평가방법 및 수료기준

평가방법 및
수료기준
* 진도율 80 이상

강의 목차

차시 차시명
1차시 강의개요 및 권장 학습순서와 NLTK 설치하기
2차시 corpus(말뭉치)란 무엇인가
3차시 nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기
4차시 nltk gutenberg corpus 여러가지 값 출력
5차시 nltk tokenization - sent_tokenize
6차시 word_tokeniz() 함수를 사용한 토큰화 vs gutenberg. words() 함수를 사용한 토큰화 비교
7차시 각 토큰당 평균 문자 수
8차시 브라운 코퍼스를 활용한 여러가지 메서드(1)
9차시 브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법
10차시 FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제
11차시 특정 단어의 빈도 수 체크
12차시 특정 단어의 빈도 수 체크 - list comprehension 사용
13차시 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습
14차시 전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크
15차시 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기
16차시 브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법
17차시 cfd 출력시 pair로 구성해서 출력하기
18차시 브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기
19차시 n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가
20차시 nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습

학습 후기

작성자 내용
등록된 후기가 없습니다.