[결과 음성]
1. 준비물
최애캐의 목소리가 담긴 고음질의 음성 파일
BGM이나 효과음이 목소리와 함께 들리거나, 저음질이거나... 하는 파일도 가능하지만, 후처리에서 시간이 오래 걸린다.
고음질의 파일을 사용하는 것이 좋다.
2. 사용 방법
0. 문외한이라면 읽고 갈 것
-AI 학습은 컴퓨터 사양이 극도로 낮으면 매우 느리거나 거의 불가능하다.
-Python 설치 후, gradio까지 설치해야 한다.
1. 윈도우 키+R 눌러 cmd를 킨다.
2. pip 업그레이드
python -m pip install --upgrade pip
3. Gradio 설치
pip를 사용하여 Gradio를 설치한다.
pip install gradio
1. GPT-SoVITS 설치
여기에서 'Download the latest prezip' 버튼을 눌러 다운로드하고, 압축을 푼다.
2. 실행
1.go-web.bat 파일을 오른클릭하여, 메모장으로 열기를 누른다.
2.zh-CN을 ko-KR로 변경한다.
3.go-web.bat를 더블 클릭하여 웹 UI를 연다.
3. 음성을 분리하자
1.오디오 자동 분리 입력 경로에 최애캐의 목소리가 담긴 음성 파일의 경로를 붙여넣는다.
2.음성 분리 활성화 버튼을 누른다.
4. ASR 도구 활성화
1.cmd 창에 중국어 메세지가 떴는지 확인한다.
2. 메세지가 존재할 경우, output/slicer_opt 폴더로 들어가서 분리된 음성 파일이 존재하는지 확인한다.
3.음성 파일이 있다면, ASR 모델을 Faster-Whisper large v3으로 변경하고, 음성의 언어를 선택한다. (한국어 음성의 경우 ko, 일본어 음성으로 만들고 싶다면 jp로 입력한다.)
4.오프라인 대량 ASR 활성화 버튼을 눌러준다.
5.list 주석 파일 경로가 원래 있던 경로가 아니라면, 활성화가 완료된 것이다.
5. 텍스트 추출
1.1-GPT-SOVITS-TTS 그룹 버튼을 누르고 모델 이름을 입력한다.(입력하지 않아도 무방)
2.스크롤을 맨 아래로 내려 일괄 처리 활성화를 클릭한다.
6. 미세 조정 훈련
1.1B-미세 조정 훈련 그룹 버튼을 누른다.
2. 설정은 예시 이미지에 나온 그대로 적용한다.
3.sovits 훈련 활성화 버튼을 눌러준다.
4.cmd 창에서 처리가 완료된 것을 확인한 후에, gPT 훈련 활성화 버튼을 눌러준다.
컴퓨터 사양이 좋으면, 같이 눌러서 처리해도 된다.
7. 참고 정보 업로드
1.1C-추론 그룹 버튼을 누르고 모델 경로 새로 고침을 한다.
2.TTS inference WebUI 버튼을 누른다.
2.새 창이 뜨는데, 아까 output/slicer_opt 폴더에 있던 분리된 예시 음성을 하나 넣는다.
3.해당 오디오의 대사를 적고, 참고 오디오의 언어도 맞는 언어로 변경한다.
8. 대망의 실행
1.읽게 하고 싶은 텍스트를 입력한다. 예문은 きみさぁ...私のこと好きでしょ?
2.결과로 나올 언어를 선택한다. 예문이 일본어니까, 나는 일본어 선택함.
(구두점을 기준으로 자르기 옵션을 선택하면 더욱 자연스럽게 대사를 읽을 수 있다.)
3.마지막으로 합성 음성 버튼을 클릭하면 옆에 결과가 나온다. 다운로드 버튼으로 다운로드도 가능하다.
'[IT관련] > IT' 카테고리의 다른 글
[지역락] 클라우드 플레어 지역 우회 방법 (0) | 2024.09.06 |
---|---|
[misskey.io] 미스키 한국에서 회원가입 하는 방법 (0) | 2024.09.06 |