[코드스테이츠/개인프로젝트] 2주 프로젝트를 앞둔 심정과 계획들😇

[코드스테이츠/개인프로젝트] 2주 프로젝트를 앞둔 심정과 계획들😇

2022. 2. 14. 18:24ㆍCode States AI

9월부터 시작한 코드스테이츠 AI 부트캠프의 교육 세션이 끝이 났다. 내일부터는 Code States Project 1 이라는 이름으로 2주간 개인 프로젝트가 진행된다.

주제에 대해서는 큰 고민 없이 SECTION 3 프로젝트를 발전시키는 방향으로 가기로 했다.

SECTION 3에서는 알라딘 베스트셀러 데이터를 사용한 콘텐츠 기반 책 추천 웹 애플리케이션을 만들었었다. 하지만 일주일은 주제와 데이터를 정하고 분석을 하기에, 추천 서비스를 만들고 배포하기에 촉박한 시간이었다. 나는 마지막 날 배포 단계에서 메모리 문제를 해결하지 못했고 결국 미완성인 채로 프로젝트를 제출했다. 어디까지나 내 기준이고 욕심이었지만, 완성하지 못한 프로젝트는 SECTION 5가 끝나도 마음에 계속 남아있었다.

앞으로 2주 간은 다시 차근차근 해보려고 한다. 급하게 진행하느라 엉망진창으로 작성했던 코드도 정리하고, 메모리 문제도 해결하고 싶다.

- 데이터 분석 및 시각화

지난 프로젝트에서는 Google DataStudio를 사용해 대시보드를 제작했었다. 하지만 DB와 연동에 애를 먹은 탓에 분석은 적당히 하고 넘어간 기억이 있다(🤦‍♂️). 이번에는 좀 더 오래 고민하고 시각화해보면서 비즈니스에 적용할 수 있는 의견을 제시하고 싶다.

- 협업 필터링과 컨텐츠 기반 필터링

지난 프로젝트 에서는 카운트 기반 벡터화 및 코사인 유사도를 사용해 콘텐츠 기반 필터링을 구현했었다. 이때 메타 데이터는 도서 설명에서 명사를 추출하는 방식을 선택했는데, 그때나 지금이나 추출한 명사가 도서를 함축할 수 있는지에 대해 의문이 든다(추천 결과는 작가나 세부 카테고리, 출판사의 영향이 더 컸을 것이다).

콘텐츠 기반 필터링은 사람이 개입하지 않는 이상 상품 정보를 함축하는데 한계가 있다. 협업 필터링은 고객 정보 없이는 추천할 수 없는 콜드 스타트 문제와 많은 계산량, 추천의 다양성이 떨어진다는 문제가 있다. 현재로서는 고객 선호도 정보가 없기 때문에 콘텐츠 기반 필터링을 선택할 예정이지만, 고객 정보를 저장해 추후 협업 필터링으로 가는 하이브리드 방식도 생각하고 있다.

- 웹 어플리케이션 제작

이번에도 플라스크를 사용해 개발할 예정이다. 로그인 기능을 추가하는 방법 등을 사용해서 고객 정보를 DB에 저장할 계획이고, 시간이 된다면 댓글 기능 등을 추가해 좀 더 완성도 있는 웹 애플리케이션을 만들고 싶다(데이터를 다루는 일 만큼이나 웹 개발에도 관심이 많다).

오늘은 지난 프로젝트를 되돌아보면서 보완해야 할 점을 생각했다. 내일부터 코드를 싹 다 갈아엎어야 하겠지만, 이번에야 말로 마무리를 짓고 싶다!

다른 건 몰라도

1. 오전 9시 전에 일어나고 새벽 2시 전에는 잠들기

2. 일주일에 세 번 이상 요가원 가기

꼭 지키자

저작자표시

'Code States AI' 카테고리의 다른 글

[코드스테이츠/개인프로젝트] 알라딘 베스트셀러 데이터를 사용한 콘텐츠 기반 책 추천 웹 애플리케이션 제작📚 (6)	2022.03.01
[PYTHON/파이썬] KoBERT를 사용한 온라인 뉴스 악성 댓글 데이터 이진 분류 (2)	2022.01.15
[PYTHON/파이썬] 워드 클라우드(Word Cloud)로 한글 데이터 시각화하기 (0)	2022.01.14

Donghae Blog

Donghae Blog

태그

최근글

댓글

공지사항

아카이브

'Code States AI' 카테고리의 다른 글

관련글

티스토리툴바