Coqui TTS를 설치
2025. 12. 17. 08:24ㆍAI 이미지 만들기/AI 프로그램 관련정보
1단계: 도구 설치하기
가장 먼저, 비어 있는 코랩 환경에 Coqui TTS를 설치해야 합니다. 명령어 앞에 !를 붙이면 파이썬 코드가 아니라 시스템 명령어로 인식됩니다.
Python
!pip install TTS
(설치 과정에서 빨간 글씨로 에러 메시지가 뜰 수도 있지만, 마지막에 'Successfully installed'가 보이면 보통 문제없이 진행됩니다.)
2단계: 모델 불러오기 & 목소리 만들기
이제 설치된 도구를 사용해 실제로 소리를 만들어 볼 차례입니다. 여기서는 VITS라는 고성능 모델을 사용해 보겠습니다.
Python
import torch
from TTS.api import TTS
# 1. GPU가 사용 가능한지 확인합니다 (가능하면 GPU를 써야 훨씬 빠릅니다!)
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"사용 중인 장치: {device}")
# 2. 모델을 불러옵니다. (처음 실행할 때는 다운로드 시간이 조금 걸립니다)
# 여기서는 영어 데이터셋인 'ljspeech'로 학습된 vits 모델을 사용합니다.
tts = TTS(model_name="tts_models/en/ljspeech/vits", progress_bar=False).to(device)
# 3. 텍스트를 오디오 파일로 변환합니다.
my_text = "This is a test running on Google Colab. Text to speech is fascinating!"
tts.tts_to_file(text=my_text, file_path="output.wav")
3단계: 소리 들어보기
파일이 생성되었으니 코랩에서 바로 들어볼까요?
Python
from IPython.display import Audio
# 생성된 오디오 파일 재생
Audio("output.wav")
여기까지 문제없이 진행되셨나요?
혹시 **"사용 중인 장치: cpu"**라고 떴다면 속도가 조금 느릴 수 있습니다. 코랩 메뉴의 [런타임] -> [런타임 유형 변경]에서 가속기를 T4 GPU로 바꾸면 훨씬 빠르게 만들 수 있답니다.
소리가 잘 들린다면, 한국어 목소리로 바꾸는 방법도 궁금하신가요?
'AI 이미지 만들기 > AI 프로그램 관련정보' 카테고리의 다른 글
| Stable Video Diffusion (SVD) 설치 및 실행 코드입니다. (0) | 2025.12.17 |
|---|---|
| [SVD] 이미지 동영상 변환기 설치 & 실행 코드 (0) | 2025.12.17 |
| 제미나이 유료 버전 - 최대 해상도는 얼마까지 가능한가요? (0) | 2025.12.17 |
| 껐다 켜도 옛날 시드를 찾아서 입력만 하면 똑같이 만들 수 있습니다! (1) | 2025.12.13 |
| ip-adapter설치법을 webui_forge 기준 (1) | 2025.12.13 |