뮤지컬 추천 웹사이트 | Notion

<aside> 📎 개발개요 및 목표

</aside>

뮤지컬에 영화, 음악 다음으로 많은 관심을 보임
주 타켓층인 20대 30대는 넷플릭스 같은 개인 성향에 맞춘 시스템에 익숙함
영화, 음악은 이미 많은 매체에서 다양한 정보가 제공되고 있으며 잘 구축됨

하지만 뮤지컬에 대한 정보제공 양은 적고, 사용자 니즈에 맞는 정보를 제공하는 사이트는 존재하지 않음
우리는 이 점을 인지하고 이를 위한 서비스 제공하고자 함

<aside> 📎 역할

</aside>

데이터 전처리 및 모델학습과 ML서버 배포

데이터 전처리 결측치 처리 : python을 사용하여 특수문자와 HTML Entity 코드 제거 텍스트 전처리 : Konlpy를 사용해 품사별로 나누기 워드 임베딩 : word2vec의 skip-gram을 사용하여 줄거리 벡터화 태그 선정 : 단어의 빈도수로 11개의 태그 선정 및 가장 유사한 단어 1000개의 단어씩 범주화 태그 저장 : 줄거리 기반 단어의 빈도수를 기준으로 태그 선정 및 범주화 후 유사도에 따른 작품당 3개의 태그 DB에 저장
모델학습 NMF를 활용한 과거 뮤지컬 작품 줄거리와 현재 상영 중, 상영 예정인 뮤지컬 작품 줄거리의 유사도를 기준으로 상위 3개의 작품 추천
ML 서버 배포 AWS를 이용하여 ML용 인스턴스(서버) 생성 및 모델링 후 추천 데이터를 웹서버에 전달하기 위해 FAST API로 매핑 및 데이터 전달 확인 후 AWS로 배포

<aside> 📎 프로젝트 구성

</aside>

프로젝트 구조
- 의존성을 위한 Maven Project