- 고객 센터
1644-2827
월 - 금09:30 ~ 18:00점심시간12:00 ~ 13:00주말,공휴일휴무
![]() 맛보기 목록 수강신청하기 |
비환급일반
모바일
[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.3 한국어를 위한 KoNLPy 2
|
||
과정소개 | 본 과정은 한국어 텍스트마이닝을 위한 KoNLPy 패키지에 대한 학습과정입니다. 한국어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 KoNLPy 패키지에 기반하여 한국어 자연어 처리를 분석하고 관련된 여러 라이브러리를 학습하는 과정입니다. |
||
학습목표 | KoNLPy 패키지를 이용한 한국어 자연어 처리에 대해 전반적인 내용을 학습하고 그에 기반하여 한국어를 분석할 수 있도록 목표한다 |
||
학습대상 | 한국어 자연어 처리 및 KoNLPy 패키지 학습에 부담을 가지는 학습자 2. 빠른 시간에 KoNLPy 패키지 및 관련 라이브러리를 배우고자 하는 자 |
||
학습방법 | 온라인 교육 ( PC + 모바일 ) | ||
강사소개 |
|
평가항목 | 진도율 | 과제 | 진행단계평가 | 최종평가 | 총점 |
---|---|---|---|---|---|
평가비율 | 100% | 0% | 0% | 0% | 100점 |
수료기준 | 80% 이상 | 0점 이상 | 0점 이상 | 0점 이상 | 80점 이상 |
평가방법 및 수료기준 |
* 진도율 80 이상 |
차시 | 차시명 |
---|---|
1차시 | KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(2) |
2차시 | KoNLPy corpus(말뭉치)를 NLTK 패키지로 분석해보기(3) |
3차시 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(1) |
4차시 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(2) |
5차시 | KoNLPy 형태소 분석기별 품사 분류표 데이터프레임으로 변환 출력(3) |
6차시 | 단어주머니란 무엇인가 - Bag of words |
7차시 | 빈도 수 기반의 핵심어 추출 |
8차시 | TF-IDF 어휘 빈도 문서 역빈도 |
9차시 | 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(1) - 토큰화 처리 |
10차시 | 자연어 처리를 위한 텍스트 수치화 작업 - BoW 구현하기(2) - WordPunctTokenizer, TreebankWordTokenizer |
11차시 | Bag of words 구현하기(3) - BoW 실습을 위한 텍스트 전처리 |
12차시 | Bag of words 구현하기(4) - stopwords, punctuation 제거 |
13차시 | 사이킷런 BoW 구현1 |
14차시 | 사이킷런 BoW 구현2 - Count Vector 수치화 |
15차시 | 사이킷런 BoW 구현3 - 단어 사전화 처리된 vocabulary_(딕셔너리) 출력해보기 |
16차시 | CountVectorizer 파라미터 옵션(1) - max_df, min_df |
17차시 | CountVectorizer 파라미터 옵션(2) - max_features, stop_words |
18차시 | CountVectorizer 파라미터 옵션(3) - ngram_range |
19차시 | TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(1) |
20차시 | TfidfVectorizer 기반의 자연어 텍스트 수치화 작업(2) |
작성자 | 내용 |
---|---|
등록된 후기가 없습니다. |