지난 주 AI in Action 라이브 #10 방송을 진행했습니다.
이번 방송의 핵심 주제는 알리바바의 오픈소스 TTS 모델인 Qwen3-TTS 실험이었는데,
기대와 다르게 완성까지 가지 못했습니다.
실패한 과정도 기록으로 남기는 게 이 블로그의 방향이라 솔직하게 정리해봅니다.
## Qwen3-TTS란?
알리바바 Qwen 팀이 개발한 텍스트-투-스피치(TTS) 모델로,
Apache 2.0 라이선스로 공개된 오픈소스입니다.
주요 스펙:
- 응답 속도: 97ms (실시간 대화에도 활용 가능한 초저지연)
- 지원 언어: 10개 언어 (한국어 포함)
- Voice Clone: 단 3초짜리 음성 샘플로 목소리 복제 가능
- 비용: 로컬 설치 시 무료 / API 사용 시 유료
OpenAI TTS와 비교하면 가격이 더 저렴하고 ($0.013/1K 글자 vs OpenAI $0.015),
처음 90일은 무료 쿼터도 넉넉하게 제공됩니다.
## 로컬 설치 시도 → 실패
고사양 GPU가 있다면 로컬에 직접 설치해서 완전 무료로 사용할 수 있습니다.
저는 GPU 없는 i7-1355U 노트북(Windows 11)에서 시도했는데,
CPU만으로는 모델 추론 속도가 너무 느려서 실용적이지 않았습니다.
결국 DashScope API로 방향을 전환했습니다.
DashScope는 알리바바 클라우드의 AI API 서비스로,
OpenAI 호환 엔드포인트를 제공해서 기존 코드를 거의 수정하지 않고 붙일 수 있습니다.
실험은 아직 진행 중입니다.
이번 주 중에 제 목소리 3초 샘플로 Voice Clone을 테스트하고,
실제 유튜브 영상 나레이션에 적용하는 것이 다음 목표입니다.
## 이번 주 다른 이야기들
**유튜브 자막 수집 자동화 — 4번 연속 실패**
CatchUp AI 유튜브 채널의 자막을 자동으로 수집하는 시스템을 구축하려다
IP 차단, yt-dlp n-challenge 오류, 라이브러리 버전 호환성 문제 등
예상치 못한 장벽을 4번 연속 만났습니다.
각 단계에서 배운 것들이 다음 시스템을 더 단단하게 만들어준다고 위안 삼고 있습니다.
**시애틀 AI 행사 2곳**
화요일 Startup 425 Accelerator Demo Day (Renton Technical College),
수요일 Big Data & AI Seattle Meetup (Bellevue City Hall)에 다녀왔습니다.
같은 AI 커뮤니티지만 창업 중심 vs 기술 실무 중심으로 분위기가 확연히 다른 두 행사였습니다.
**CMDS x GOBI Cohort W3 — Voice-First 학습**
목요일에는 CMDS x GOBI 코호트 3주차 세션이 있었습니다.
말로 브레인스토밍하면 AI가 구조화해주는 Voice-First 방식을 체험했는데,
Gobi Desktop의 실시간 데모가 인상적이었습니다.
**Builders Lounge → 창발 스페이스로**
시애틀 한인 IT 빌더 커뮤니티인 Builders Lounge가
창발(Changbal) 스페이스 안에 자리를 잡았습니다.
각자의 Product를 들고 나와 서로의 첫 번째 고객이 되는 방식으로 운영됩니다.
## 이번 방송에서 기억에 남는 한 마디
> "AI 시대에는 인간이 병목이다"
AI는 이미 빠르게 달릴 준비가 됐는데,
방향을 잡고 판단하는 사람의 속도가 전체를 좌우한다는 의미입니다.
공부를 계속하는 이유가 이 병목을 줄이기 위해서라는 생각이 들었습니다.
## 영상 보기
요약 영상으로 편집해서 유튜브에 올렸습니다.
🇰🇷 한국어 영상 → https://youtu.be/k8iksu8C6uI
🇺🇸 영어 영상 → https://youtu.be/qTNVc_PIWQw




'Catchup AI' 카테고리의 다른 글
| 시애틀 한인 AI 빌더 커뮤니티 "Builders Lounge" 창립 모임 — AI가 나 대신 포스팅하는 시대가 열렸다 (0) | 2026.05.16 |
|---|---|
| AI in Action #9 — 시애틀에서 시도하는 AI 일상 적용 실험 기록 (0) | 2026.05.15 |
| 시애틀 사람들은 AI를 어떻게 느낄까? — 거부부터 열정까지 5가지 민심 + 법명 받은 AI 스님 (1) | 2026.05.09 |
| AI in Action Live 8회 요약 — 한 주에 콘텐츠 7편, 그리고 AI가 내 마음을 읽은 순간 (0) | 2026.05.06 |
| AI 시대, 진짜 희소한 것은 '휴먼터치'다 — 한국어 + 영어 버전 동시 공개 (1) | 2026.05.03 |
| AI가 스스로 우회로를 찾는 시대: 소프트웨어 개발 프로세스의 미래를 엿보다 (0) | 2026.04.29 |
| AI와 함께 방송을 진행한다는 것 — AI in Action Live #7 실험 기록 (0) | 2026.04.28 |
| 미국 공공 IT 시장의 문이 열렸다 — 워싱턴 주 정부와 일하는 법 [현장 취재] (0) | 2026.04.18 |
| AI가 방송하고, 일정 짜고, 버그까지 찾았습니다 — 이번 주 AI 실험 총결산 (0) | 2026.04.13 |
| AI가 나를 마당으로 내보냈습니다 - 잔디 관리로 배운 초개인화의 본질 (0) | 2026.04.11 |
