Qwen3-TTS
2026/01/22 공개된 TTS 모델. 단순 TTS가 아니라 유저의 보이스클로닝 기능을 포함하고 있으며 한국어까지 지원된다고 함.
테스트 환경
•
맥북 프로 M2 Pro. 16GB RAM
•
PyTorch
•
Python 3.10.19
•
Qwen/Qwen3-TTS-12Hz-0.6B-Base
TTS에 레퍼런스로 입력한 음성 파일
안녕하세요. 이것은 제 목소리 테스트입니다.
Plain Text
복사
TTS로 생성한 음성 파일
•
요청한 텍스트
안녕하세요. TTS 모델 테스트입니다. 오늘 날씨가 정말 많이 춥습니다. 내일 출근하기 싫어요.
Plain Text
복사
•
만들어진 오디오 파일
제 목소리를 녹음한 것입니다. 안녕하세요. TTS 모델 테스트입니다. 오늘 날씨가 정말 많이 춥습니다. 내일 출근하기 싫어요.
Plain Text
복사
•
조금 밝은 목소리로 녹음한 레퍼런스 음성을 사용한 경우
결론
•
TTS로 생성한 음성이 오히려 더 자연스럽다. 
•
“제 목소리를 녹음한 것입니다” < 이건 왜 TTS에 들어갔는지 모르겠음.
•
고작 3초정도 되는 레퍼런스 오디오만 있어도 보이스클로닝이 가능한 세상이 왔습니다.
