반응형
블로그 이미지
개발자로서 현장에서 일하면서 새로 접하는 기술들이나 알게된 정보 등을 정리하기 위한 블로그입니다. 운 좋게 미국에서 큰 회사들의 프로젝트에서 컬설턴트로 일하고 있어서 새로운 기술들을 접할 기회가 많이 있습니다. 미국의 IT 프로젝트에서 사용되는 툴들에 대해 많은 분들과 정보를 공유하고 싶습니다.
솔웅

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

카테고리


반응형

요즘 이런 생각을 자주 합니다.

AI가 점점 더 많은 일을 대신하게 되면서, 사람들이 조용히 이런 질문을 품기 시작했습니다.

"나는 쓸모 있는 사람인가?"

거창한 질문처럼 보이지만, 사실 이건 아주 오래된 질문입니다. AI가 등장하기 훨씬 전부터 우리 안에 있었던 불안이죠. AI는 그것을 새로 만들어 낸 게 아니라, 이미 있던 것을 더 선명하게 드러내고 있을 뿐입니다.

이 주제를 오랫동안 생각해 왔고, 결국 글과 영상으로 정리했습니다. 한국어와 영어 버전을 모두 만들었으니, 편하신 언어로 보시거나 주변에 공유해 주세요.


영상으로 보기

바쁜 일상 속에서 글보다 영상이 편하신 분들을 위해 유튜브 영상도 함께 만들었습니다.

 

한국어 영상 — https://youtu.be/DgqbSLjDT-A

 

English Version — https://youtu.be/n8l5Vm_blkE

 


글로 읽기

더 깊이 읽고 싶으신 분들을 위해 Substack에 전문을 올렸습니다.

 

📄 한국어 — https://lifidea.substack.com/p/040?r=57u2e2

 

모두가 자신의 무가치함과 싸우고 있다 - 가치는 누가 정하는가

AI 시대 가치를 정하는 기준을 바꾸어야 하지 않을까? - 우리의 행복을 위해서...

lifidea.substack.com

 

📄 English — https://lifidea.substack.com/p/everyone-is-fighting-their-own-worthlessness?r=57u2e2

 

Everyone Is Fighting Their Own Worthlessness — Who Gets to Decide Your Value?

In the age of AI, shouldn't we change the standard by which value is measured — for our own happiness?

lifidea.substack.com

 

 

 

 

반응형


반응형

지난 주 AI in Action 라이브 #10 방송을 진행했습니다.

이번 방송의 핵심 주제는 알리바바의 오픈소스 TTS 모델인 Qwen3-TTS 실험이었는데,

기대와 다르게 완성까지 가지 못했습니다.

실패한 과정도 기록으로 남기는 게 이 블로그의 방향이라 솔직하게 정리해봅니다.

 

## Qwen3-TTS란?

 

알리바바 Qwen 팀이 개발한 텍스트-투-스피치(TTS) 모델로,

Apache 2.0 라이선스로 공개된 오픈소스입니다.

 

주요 스펙:

- 응답 속도: 97ms (실시간 대화에도 활용 가능한 초저지연)

- 지원 언어: 10개 언어 (한국어 포함)

- Voice Clone: 단 3초짜리 음성 샘플로 목소리 복제 가능

- 비용: 로컬 설치 시 무료 / API 사용 시 유료

 

OpenAI TTS와 비교하면 가격이 더 저렴하고 ($0.013/1K 글자 vs OpenAI $0.015),

처음 90일은 무료 쿼터도 넉넉하게 제공됩니다.

## 로컬 설치 시도 → 실패

 

고사양 GPU가 있다면 로컬에 직접 설치해서 완전 무료로 사용할 수 있습니다.

저는 GPU 없는 i7-1355U 노트북(Windows 11)에서 시도했는데,

CPU만으로는 모델 추론 속도가 너무 느려서 실용적이지 않았습니다.

 

결국 DashScope API로 방향을 전환했습니다.

DashScope는 알리바바 클라우드의 AI API 서비스로,

OpenAI 호환 엔드포인트를 제공해서 기존 코드를 거의 수정하지 않고 붙일 수 있습니다.

 

실험은 아직 진행 중입니다.

이번 주 중에 제 목소리 3초 샘플로 Voice Clone을 테스트하고,

실제 유튜브 영상 나레이션에 적용하는 것이 다음 목표입니다.



## 이번 주 다른 이야기들

 

**유튜브 자막 수집 자동화 — 4번 연속 실패**

 

CatchUp AI 유튜브 채널의 자막을 자동으로 수집하는 시스템을 구축하려다

IP 차단, yt-dlp n-challenge 오류, 라이브러리 버전 호환성 문제 등

예상치 못한 장벽을 4번 연속 만났습니다.

각 단계에서 배운 것들이 다음 시스템을 더 단단하게 만들어준다고 위안 삼고 있습니다.

 

**시애틀 AI 행사 2곳**

 

화요일 Startup 425 Accelerator Demo Day (Renton Technical College),

수요일 Big Data & AI Seattle Meetup (Bellevue City Hall)에 다녀왔습니다.

같은 AI 커뮤니티지만 창업 중심 vs 기술 실무 중심으로 분위기가 확연히 다른 두 행사였습니다.

 

**CMDS x GOBI Cohort W3 — Voice-First 학습**

 

목요일에는 CMDS x GOBI 코호트 3주차 세션이 있었습니다.

말로 브레인스토밍하면 AI가 구조화해주는 Voice-First 방식을 체험했는데,

Gobi Desktop의 실시간 데모가 인상적이었습니다.

 

**Builders Lounge → 창발 스페이스로**

 

시애틀 한인 IT 빌더 커뮤니티인 Builders Lounge가

창발(Changbal) 스페이스 안에 자리를 잡았습니다.

각자의 Product를 들고 나와 서로의 첫 번째 고객이 되는 방식으로 운영됩니다.



## 이번 방송에서 기억에 남는 한 마디

 

> "AI 시대에는 인간이 병목이다"

 

AI는 이미 빠르게 달릴 준비가 됐는데,

방향을 잡고 판단하는 사람의 속도가 전체를 좌우한다는 의미입니다.

공부를 계속하는 이유가 이 병목을 줄이기 위해서라는 생각이 들었습니다.



## 영상 보기

 

요약 영상으로 편집해서 유튜브에 올렸습니다.

 

🇰🇷 한국어 영상 → https://youtu.be/k8iksu8C6uI

 

 

🇺🇸 영어 영상 → https://youtu.be/qTNVc_PIWQw

 

 

 

 

 

 

반응형


반응형

미국 시애틀/벨뷰 지역에서 활동하는 한인 IT 엔지니어들이 

"Builders Lounge(빌더스 라운지)"라는 이름으로 첫 공식 모임을 가졌습니다.

 

이 블로그를 오래 보셨던 분들은 아시겠지만, 저는 17년 전 미국에 처음 왔을 때부터 

여기서 배운 새로운 IT 기술과 소식들을 기록해 왔습니다.

 

그리고 요즘 제가 가장 열심히 파고 있는 분야가 바로 AI입니다.



■ Builders Lounge란?

 

시애틀/벨뷰 지역을 중심으로 활동하는 한인 AI 빌더들의 모임입니다.

단순히 AI 소식을 공유하는 스터디가 아니라, 각자가 AI로 만들고 있는 

프로젝트를 직접 들고 와서 함께 실험하고 피드백을 나누는 자리입니다.



■ 첫 모임에서 무엇을 했나?

 

이번 첫 모임의 핵심은 GOBI Space와 GOBI Desktop 실습이었습니다.

 

GOBI는 AI 기반 소셜 PKM(개인 지식 관리) 플랫폼으로, 

가장 인상적인 기능은 바로 "Social Agent"입니다.

 

내가 말하면 → AI가 정리해서 → 커뮤니티에 대신 포스팅해 줍니다.

 

직접 써보기 전까지는 반신반의했는데, 

참가자 전원이 핸즈온 세션에서 직접 체험해보니 

"이게 되네?"라는 반응이 터져 나왔습니다 😄

 

이 기술이 흥미로운 이유는, 단순한 자동화가 아니라

AI가 맥락을 이해하고 나의 언어로 글을 써준다는 점입니다.

콘텐츠 생산의 부담이 확 줄어드는 경험이었습니다.



■ 앞으로의 방향

 

Builders Lounge는 매달 정기 모임을 이어갈 예정입니다.

AI에 관심 있는 분이라면 누구든 참여하실 수 있습니다.

관심 있으신 분은 gobispace.com 에서 가입 후 

창발(Changbal) 스페이스에 참여 의사를 남겨 주세요.



■ 첫 모임 풀영상

 

▶️ https://youtu.be/AoOhKZ4LoKs

 

25분 분량으로 편집된 영상이지만, 

현장의 열기와 실습 과정이 그대로 담겨 있습니다.

AI를 일상에 적용하고 싶은 분들께 좋은 참고가 되실 거라 생각합니다.

 

반응형