강의 썸네일

맛보기

목록


수강신청하기

비환급일반
모바일
[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.3 한국어를 위한 KoNLPy 2
학습분량
20차시
NCS분류
02020302(사무행정)
교육기간
30일 (7시간)
복습기간
7일
환급유형
비환급일반
 
 
교육비용
₩ 40,000
결제금액
₩ 40,000

과정소개

과정소개

본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다.

학습목표

KoNLPy 패키지를 이용한 한국어 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 한국어를 분석할 수 있도록 목표한다

학습대상

한국어 자연어 처리 및 KoNLPy 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 KoNLPy 패키지 및 관련 라이브러리를 배우고자 하는 자

학습방법 온라인 교육 ( PC + 모바일 )
강사소개
등록된 강사정보가 없습니다.

평가기준

평가항목 진도율 과제 진행단계평가 최종평가 총점
평가비율 100% 0% 0% 0% 100점
수료기준 80% 이상 0점 이상 0점 이상 0점 이상 80점 이상

평가방법 및 수료기준

평가방법 및
수료기준
* 진도율 80 이상

강의 목차

차시 차시명
1차시 KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2)
2차시 KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3)
3차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1)
4차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2)
5차시 KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3)
6차시 단어주머니란 무엇인가 - Bag of words
7차시 빈도 수 기반의 핵심어 추출
8차시 TF-IDF 어휘 빈도 문서 역빈도
9차시 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리
10차시 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer
11차시 Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리
12차시 Bag of words 구현하기(4) - stopwords, punctuation 제거
13차시 사이킷런 BoW 구현1
14차시 사이킷런 BoW 구현2 - Count Vector 수치화
15차시 사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기
16차시 CountVectorizer 파라미터 옵션(1) - max_df, min_df
17차시 CountVectorizer 파라미터 옵션(2) - max_features, stop_words
18차시 CountVectorizer 파라미터 옵션(3) - ngram_range
19차시 TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1)
20차시 TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2)

학습 후기

작성자 내용
등록된 후기가 없습니다.