본문 바로가기

프로젝트

(3)
이론 > 트랜스퍼 러닝 트랜스퍼 러닝 : 특정 태스크를 학습한 모델을 다른 태스크 수행에 재사용하는 기법. - 태스크1: 업스트림 태스크(ex. 다음 단어 맞히기, 빈칸채우기 등) / 태스크2: 다운스트림 태스크(ex. 문서 분류, 개체명 인식 등) - 프리트레인: 업스트림 태스크를 학습하는 과정 - 기존보다 모델의 학습 속도가 빨라지고 새로운 태스크를 더 잘 수행하는 경향이 있다. 업스크림 태스크 대표적인 태스크 가운데 하나가 다음 단어 맞히기 입니다. GPT 계열 모델이 바로 이 태스크로 프리트레인을 수행합니다. 예를 들어 티끌 모아라는 문맥이 주어졌고 학습 데이터 말뭉치에 티끌 모다 태산이라는 구가 많다고 하면 모델은 이를 바탕으로 다음에 올 단어를 태산으로 분류..
음악 장르 경향 분석 1) 주제 선정 이유 - 요즘 많은 사람들이 음악과 함께 살아가고 있습니다. 길거리 어디를 돌아다니든 음악이 나오는 것을 들을 수 있습니다. 저도 음악을 좋아하는 한 사람으로써 평소 음악을 많이 듣습니다. 음악을 듣다보면 개인 마다 좋아하는 음악 스타일이 다르기도하고 계절별로 음원 사이트 상위를 장식하는 음악의 장르가 달라지는 것을 확인 할 수 있습니다, 저는 이번 텀프로젝트를 통해 사람들이 계절별로 어떤 장르의 노래를 선호하는지, 해가 거듭하면서 어떤 장르들이 사랑받는지에 관해 데이터를 분석하고 계절별로 어떤 장르의 노래를 출시해야 성공가능성이 높은지 분석해보고 싶어졌습니다. 또한 분석한 데이터를 토대로 어떤 장르의 노래를 어느 계절에 내야 가장 히트를 칠지 예상해보도록 하겠습니다. 2) 인터넷을 통한..
간단한 챗봇 만들기 1) 챗봇이란? - 챗봇이란 메신저에서 일상 언어로 대화할 수 있는 채팅로봇 프로그램입니다. 이번 프로젝트는 자연어 처리를 이용한 심리상담 챗봇 구현을 목표로 잡았습니다. 2) 주제 선정 이유 - 요즘 들어 우울감을 느끼는 사람의 수간 증가하고 있다. 이는 코로나 이후로 특히 심해지고 있는 현상으로 현대 사회의 심각한 문제이다. 하지만 매번 사람들을 만나서 우울감을 풀기에는 상황이 여의치 않는 사람들이 있을 수도 있다. 나는 그런 사람들을 위해 그분들의 이야기를 들어주고 텍스트로 나마 위로를 줄 수 있는 챗봇을 구현해보고자 한다. 3) 활용 데이터 - github.com/songys/Chatbot_data (감정 클래스 데이터 셋) - https://raw.githubusercontent.com/keir..