데이터시각화 (1) 썸네일형 리스트형 [PYTHON/파이썬] 워드 클라우드(Word Cloud)로 한글 데이터 시각화하기 자연어 처리 글에서 꼭 한 번씩 보이는 워드 클라우드(Word Cloud) * 워드 클라우드 또는 태그 클라우드란 데이터의 중요도나 인기도를 고려하여 2차원으로 시각화한 것을 말한다(출처 위키백과). 프로젝트에서 한글 데이터를 다루면서 처음으로 사용해봤다. 우선 결과물부터 보자. 사용한 데이터는 Korean HateSpeech Dataset으로 편견, 혐오 표현, 모욕에 대한 한국어 온라인 뉴스 댓글 데이터셋이다. 시각화에는 데이터셋 중에서도 Gender-related bias 특성이 True로 라벨링 된 데이터를 사용했다. 시각화 *모든 코드는 코랩 환경에서 실행했다. 사용한 데이터셋이 문장으로 되어 있었기 때문에, 시각화에 앞서 형태소 분석기로 명사만 추출했다. 형태소 분석기로는 Mecab을 사용했다.. 이전 1 다음