mumo_logo.png

<aside> 📎 개발개요 및 목표

</aside>

<aside> 📎 역할

</aside>

  1. 데이터 전처리 결측치 처리 : python을 사용하여 특수문자와 HTML Entity 코드 제거 텍스트 전처리 : Konlpy를 사용해 품사별로 나누기 워드 임베딩 : word2vec의 skip-gram을 사용하여 줄거리 벡터화 태그 선정 : 단어의 빈도수로 11개의 태그 선정 및 가장 유사한 단어 1000개의 단어씩 범주화 태그 저장 : 줄거리 기반 단어의 빈도수를 기준으로 태그 선정 및 범주화 후 유사도에 따른 작품당 3개의 태그 DB에 저장
  2. 모델학습 NMF를 활용한 과거 뮤지컬 작품 줄거리와 현재 상영 중, 상영 예정인 뮤지컬 작품 줄거리의 유사도를 기준으로 상위 3개의 작품 추천
  3. ML 서버 배포 AWS를 이용하여 ML용 인스턴스(서버) 생성 및 모델링 후 추천 데이터를 웹서버에 전달하기 위해 FAST API로 매핑 및 데이터 전달 확인 후 AWS로 배포

<aside> 📎 프로젝트 구성

</aside>