Search
🔉

MLX-Audio Qwen3-TTS 개인 보이스 클로닝 TTS 만들기

태그

Qwen3-TTS

2026/01/22 공개된 TTS 모델. 단순 TTS가 아니라 유저의 보이스클로닝 기능을 포함하고 있으며 한국어까지 지원된다고 함.

테스트 환경

맥북 프로 M2 Pro. 16GB RAM
PyTorch
Python 3.10.19
Qwen/Qwen3-TTS-12Hz-0.6B-Base

TTS에 레퍼런스로 입력한 음성 파일

안녕하세요. 이것은 제 목소리 테스트입니다.
Plain Text
복사

TTS로 생성한 음성 파일

요청한 텍스트
안녕하세요. TTS 모델 테스트입니다. 오늘 날씨가 정말 많이 춥습니다. 내일 출근하기 싫어요.
Plain Text
복사
만들어진 오디오 파일
제 목소리를 녹음한 것입니다. 안녕하세요. TTS 모델 테스트입니다. 오늘 날씨가 정말 많이 춥습니다. 내일 출근하기 싫어요.
Plain Text
복사
조금 밝은 목소리로 녹음한 레퍼런스 음성을 사용한 경우

결론

TTS로 생성한 음성이 오히려 더 자연스럽다.
“제 목소리를 녹음한 것입니다” < 이건 왜 TTS에 들어갔는지 모르겠음.
고작 3초정도 되는 레퍼런스 오디오만 있어도 보이스클로닝이 가능한 세상이 왔습니다.