한글 언어 자원과 R: KoNLP 개선 사례와 활용을 중심으로
R기반의 한국어 텍스트 분석 패키지인 KoNLP의 소개와 신규 버전의 개선사항들에 대해서 공유하고, 이를 기반으로 활용 가능한 다양한 텍스트 분석 방식을 제안한다.
연사소개
현재 SK Telecom의 Data Scientist로서 R의 한국어 텍스트 분석 패키지인 KoNLP와 Sejong, NIA_KDic(on github), Ruchardet, BOPR(on github) 등의 다양한 패키지 등을 개발하였고 ggmap, knitr 패키지의 contributor이기도 하다. 이전에는 Yahoo! Search R&D developer였으며 저서로는 R로 하는 데이터 시각화가 있고 번역서로 실전예제로 살펴보는 집단지성 프로그래밍이 있다.