Donghae Blog

Donghae Blog

  • Category (121)
    • Computer Science (28)
      • Computational thinking (7)
      • Algorithem (10)
      • Data structure (6)
      • Operating system (5)
    • Programming (25)
      • C (20)
      • Python (3)
      • SQL (2)
    • Data Engineering (3)
      • Linux (1)
      • Docker (1)
      • Apache Airflow (3)
      • Apache Spark (5)
      • BigQuery (5)
      • Datahub (1)
    • Problem Solving (26)
      • Baekjoon Online Judge (13)
      • Programmers (10)
      • CodeUp (2)
    • Conference (2)
    • Code States AI (4)
    • LIKELION 9th (12)
    • Writing (5)
  • 홈
  • 태그
  • 방명록
  • 글쓰기
RSS 피드
로그인
로그아웃 글쓰기 관리

Donghae Blog

컨텐츠 검색

태그

멋쟁이사자처럼 파이썬 프로그래머스 문자열 bigquery 포인터 cs50 백준 시간복잡도 Django 스택 자료구조 알고리즘 장고 c언어 배열 글또 네이버 부스트코스 코딩테스트

최근글

댓글

공지사항

아카이브

워드클라우드(1)

  • [PYTHON/파이썬] 워드 클라우드(Word Cloud)로 한글 데이터 시각화하기

    자연어 처리 글에서 꼭 한 번씩 보이는 워드 클라우드(Word Cloud) * 워드 클라우드 또는 태그 클라우드란 데이터의 중요도나 인기도를 고려하여 2차원으로 시각화한 것을 말한다(출처 위키백과). 프로젝트에서 한글 데이터를 다루면서 처음으로 사용해봤다. 우선 결과물부터 보자. 사용한 데이터는 Korean HateSpeech Dataset으로 편견, 혐오 표현, 모욕에 대한 한국어 온라인 뉴스 댓글 데이터셋이다. 시각화에는 데이터셋 중에서도 Gender-related bias 특성이 True로 라벨링 된 데이터를 사용했다. 시각화 *모든 코드는 코랩 환경에서 실행했다. 사용한 데이터셋이 문장으로 되어 있었기 때문에, 시각화에 앞서 형태소 분석기로 명사만 추출했다. 형태소 분석기로는 Mecab을 사용했다..

    2022.01.14
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바