반응형
블로그 이미지
개발자로서 현장에서 일하면서 새로 접하는 기술들이나 알게된 정보 등을 정리하기 위한 블로그입니다. 운 좋게 미국에서 큰 회사들의 프로젝트에서 컬설턴트로 일하고 있어서 새로운 기술들을 접할 기회가 많이 있습니다. 미국의 IT 프로젝트에서 사용되는 툴들에 대해 많은 분들과 정보를 공유하고 싶습니다.
솔웅

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

카테고리


반응형

지난 주 AI in Action 라이브 #10 방송을 진행했습니다.

이번 방송의 핵심 주제는 알리바바의 오픈소스 TTS 모델인 Qwen3-TTS 실험이었는데,

기대와 다르게 완성까지 가지 못했습니다.

실패한 과정도 기록으로 남기는 게 이 블로그의 방향이라 솔직하게 정리해봅니다.

 

## Qwen3-TTS란?

 

알리바바 Qwen 팀이 개발한 텍스트-투-스피치(TTS) 모델로,

Apache 2.0 라이선스로 공개된 오픈소스입니다.

 

주요 스펙:

- 응답 속도: 97ms (실시간 대화에도 활용 가능한 초저지연)

- 지원 언어: 10개 언어 (한국어 포함)

- Voice Clone: 단 3초짜리 음성 샘플로 목소리 복제 가능

- 비용: 로컬 설치 시 무료 / API 사용 시 유료

 

OpenAI TTS와 비교하면 가격이 더 저렴하고 ($0.013/1K 글자 vs OpenAI $0.015),

처음 90일은 무료 쿼터도 넉넉하게 제공됩니다.

## 로컬 설치 시도 → 실패

 

고사양 GPU가 있다면 로컬에 직접 설치해서 완전 무료로 사용할 수 있습니다.

저는 GPU 없는 i7-1355U 노트북(Windows 11)에서 시도했는데,

CPU만으로는 모델 추론 속도가 너무 느려서 실용적이지 않았습니다.

 

결국 DashScope API로 방향을 전환했습니다.

DashScope는 알리바바 클라우드의 AI API 서비스로,

OpenAI 호환 엔드포인트를 제공해서 기존 코드를 거의 수정하지 않고 붙일 수 있습니다.

 

실험은 아직 진행 중입니다.

이번 주 중에 제 목소리 3초 샘플로 Voice Clone을 테스트하고,

실제 유튜브 영상 나레이션에 적용하는 것이 다음 목표입니다.



## 이번 주 다른 이야기들

 

**유튜브 자막 수집 자동화 — 4번 연속 실패**

 

CatchUp AI 유튜브 채널의 자막을 자동으로 수집하는 시스템을 구축하려다

IP 차단, yt-dlp n-challenge 오류, 라이브러리 버전 호환성 문제 등

예상치 못한 장벽을 4번 연속 만났습니다.

각 단계에서 배운 것들이 다음 시스템을 더 단단하게 만들어준다고 위안 삼고 있습니다.

 

**시애틀 AI 행사 2곳**

 

화요일 Startup 425 Accelerator Demo Day (Renton Technical College),

수요일 Big Data & AI Seattle Meetup (Bellevue City Hall)에 다녀왔습니다.

같은 AI 커뮤니티지만 창업 중심 vs 기술 실무 중심으로 분위기가 확연히 다른 두 행사였습니다.

 

**CMDS x GOBI Cohort W3 — Voice-First 학습**

 

목요일에는 CMDS x GOBI 코호트 3주차 세션이 있었습니다.

말로 브레인스토밍하면 AI가 구조화해주는 Voice-First 방식을 체험했는데,

Gobi Desktop의 실시간 데모가 인상적이었습니다.

 

**Builders Lounge → 창발 스페이스로**

 

시애틀 한인 IT 빌더 커뮤니티인 Builders Lounge가

창발(Changbal) 스페이스 안에 자리를 잡았습니다.

각자의 Product를 들고 나와 서로의 첫 번째 고객이 되는 방식으로 운영됩니다.



## 이번 방송에서 기억에 남는 한 마디

 

> "AI 시대에는 인간이 병목이다"

 

AI는 이미 빠르게 달릴 준비가 됐는데,

방향을 잡고 판단하는 사람의 속도가 전체를 좌우한다는 의미입니다.

공부를 계속하는 이유가 이 병목을 줄이기 위해서라는 생각이 들었습니다.



## 영상 보기

 

요약 영상으로 편집해서 유튜브에 올렸습니다.

 

🇰🇷 한국어 영상 → https://youtu.be/k8iksu8C6uI

 

 

🇺🇸 영어 영상 → https://youtu.be/qTNVc_PIWQw

 

 

 

 

 

 

반응형


반응형

미국 시애틀/벨뷰 지역에서 활동하는 한인 IT 엔지니어들이 

"Builders Lounge(빌더스 라운지)"라는 이름으로 첫 공식 모임을 가졌습니다.

 

이 블로그를 오래 보셨던 분들은 아시겠지만, 저는 17년 전 미국에 처음 왔을 때부터 

여기서 배운 새로운 IT 기술과 소식들을 기록해 왔습니다.

 

그리고 요즘 제가 가장 열심히 파고 있는 분야가 바로 AI입니다.



■ Builders Lounge란?

 

시애틀/벨뷰 지역을 중심으로 활동하는 한인 AI 빌더들의 모임입니다.

단순히 AI 소식을 공유하는 스터디가 아니라, 각자가 AI로 만들고 있는 

프로젝트를 직접 들고 와서 함께 실험하고 피드백을 나누는 자리입니다.



■ 첫 모임에서 무엇을 했나?

 

이번 첫 모임의 핵심은 GOBI Space와 GOBI Desktop 실습이었습니다.

 

GOBI는 AI 기반 소셜 PKM(개인 지식 관리) 플랫폼으로, 

가장 인상적인 기능은 바로 "Social Agent"입니다.

 

내가 말하면 → AI가 정리해서 → 커뮤니티에 대신 포스팅해 줍니다.

 

직접 써보기 전까지는 반신반의했는데, 

참가자 전원이 핸즈온 세션에서 직접 체험해보니 

"이게 되네?"라는 반응이 터져 나왔습니다 😄

 

이 기술이 흥미로운 이유는, 단순한 자동화가 아니라

AI가 맥락을 이해하고 나의 언어로 글을 써준다는 점입니다.

콘텐츠 생산의 부담이 확 줄어드는 경험이었습니다.



■ 앞으로의 방향

 

Builders Lounge는 매달 정기 모임을 이어갈 예정입니다.

AI에 관심 있는 분이라면 누구든 참여하실 수 있습니다.

관심 있으신 분은 gobispace.com 에서 가입 후 

창발(Changbal) 스페이스에 참여 의사를 남겨 주세요.



■ 첫 모임 풀영상

 

▶️ https://youtu.be/AoOhKZ4LoKs

 

25분 분량으로 편집된 영상이지만, 

현장의 열기와 실습 과정이 그대로 담겨 있습니다.

AI를 일상에 적용하고 싶은 분들께 좋은 참고가 되실 거라 생각합니다.

 

반응형


반응형

미국에 온 지 17년이 됐습니다.

처음 이 블로그를 시작했을 때는 iPhone이 막 나오던 시절이었고, 클라우드라는 단어가 낯설던 때였습니다. 그 이후로 스마트폰 혁명, 소셜 미디어, 빅데이터, 딥러닝… 수많은 기술의 파도가 지나갔는데, 지금 제가 느끼는 건 그 어떤 때보다도 변화의 속도가 빠르다는 겁니다.

그 중심에 있는 AI. 그냥 쓰는 것을 넘어서, 직접 만들고 실험하고 기록하기 시작했습니다. 매주 일요일 AI in Action 라이브 방송을 진행하고 있고, 이번 9회 방송 요약 영상을 유튜브에 올렸습니다. 이 글에서는 영상에 담긴 주요 실험들과 그 과정에서 배운 것들을 공유합니다.


1. 영상 자체가 실험이다 — 완전 자동화 영상 제작 파이프라인

이번 AI in Action #9 요약 영상은 처음부터 끝까지 코드로 만들었습니다.

사용한 도구들:

  • Remotion: React 기반의 영상 제작 프레임워크. 슬라이드 하나하나를 TypeScript 컴포넌트로 작성하면 MP4로 렌더링됩니다.
  • Claude Code: 코드 작성, 구조 설계, 스크립트 교정까지 AI와 페어 프로그래밍으로 진행.
  • gpt-image-2: OpenAI의 최신 이미지 생성 모델. 27개 슬라이드 중 14장의 실사 이미지를 자동 생성.
  • edge-tts (Microsoft): 한국어 TTS 나레이션. ko-KR-SunHiNeural(여성)과 ko-KR-InJoonNeural(남성) 두 목소리로 전체 나레이션 처리.
  • Gemini gemini-3-pro-image-preview: 유튜브 썸네일 생성. gpt-image-2로 시도했을 때 한국어 텍스트 렌더링이 불안정해서 Gemini로 전환했는데 결과가 훨씬 좋았습니다.

스크립트 작성 → 슬라이드 코딩 → 이미지 생성 → 오디오 생성 → 영상 렌더링까지, 수동 편집 없이 자동화된 파이프라인으로 한국어 16분 57초, 영어 14분 59초 두 편을 완성했습니다.

제작 중에 겪은 버그들 (이런 내용이 실제로 더 배울 게 많습니다):

  • Python Pillow로 썸네일 텍스트를 합성했더니 이모지가 전부 □로 출력 → Malgun Gothic 폰트에 이모지 글리프가 없어서 발생. Gemini로 전환하면서 해결.
  • Gobi CLI로 커뮤니티 포스팅 시도했더니 HTTP 404 오류 → 설치된 버전이 v2.0.3이었고 API가 더 높은 버전을 요구. npm install -g @gobi-ai/cli로 v2.0.19 업그레이드 후 해결.
  • 포스트 내용이 중간에 잘리는 현상 → 텍스트 내 스마트 따옴표(", ")가 CLI 파싱 단계에서 문자열을 종료시켜 버림. 일반 따옴표로 교체 후 정상화.
  • 커뮤니티 포스트에서 특정 항목 이후 글자에 취소선이 표시 → M1~M5처럼 범위를 표시하는 물결표(~)를 Gobi 마크다운 파서가 취소선 기호로 인식. -로 교체 후 해결.

이런 크고 작은 버그들을 하나씩 해결해 나가는 것 자체가 시스템을 더 단단하게 만드는 과정입니다.


2. 유타 프로젝트 — 도메인 전문가 + AI의 만남

시애틀에서 저, 유타에서 이선생님. 매주 목요일 화상통화로 진행하는 건강관리 앱 개발 프로젝트입니다.

이선생님은 한국과 미국에서 수십 년간 의료 공직에 계셨던 분으로, 본인의 전문 지식을 바탕으로 한 건강관리 서비스를 오랫동안 구상해 오셨습니다. 개발 경험은 전혀 없으시지만, 깊은 도메인 지식을 갖고 계십니다.

  • 7주간의 과정:

요구사항 정리 → 서비스 기획 → 웹 프로토타입 → 검증 → 현재: React Native 모바일 MVP 개발 중.

일반적으로 이 단계까지 오려면 전문 개발팀과 6개월 이상의 시간이 필요합니다. AI와 함께라면 이야기가 달라집니다.

원격 개발 협업에 사용한 기술 스택:

  • Expo Go: 앱스토어 출시 없이 실제 스마트폰에서 앱 테스트 가능
  • EAS Update (Expo Application Services): 시애틀에서 코드 수정 → 유타 스마트폰 앱 즉시 업데이트

비개발자가 AI와 함께 자신의 아이디어를 앱으로 만들어 나가는 이 실험 자체가 앞으로 많은 분들에게 참고가 될 것이라 생각합니다.


3. Vibe Guiding — AI 가이드의 다음 단계

이번 주 가장 집중한 실험입니다. M1 개념 정립부터 시작해 이번 주에 M2~M5를 한 번에 완주했습니다.

  • 기존 AI 챗봇과의 차이:

일반 AI 챗봇은 문서를 검색해서 방법을 알려줍니다. 하지만 이 사용자가 어떤 OS를 쓰는지, 현재 어떤 버전이 설치되어 있는지, 지금 정확히 어떤 오류 상태인지는 알지 못합니다.

Vibe Guiding은 사용자의 실제 환경을 읽고, 그 상황에 맞는 단계별 가이드를 제공하며, 완료 신호까지 안내합니다. "이 메시지가 나오면 성공한 것입니다" — 추측이 아닌 검증입니다.

Atomic Guide Unit 구조:

  • Goal → Prerequisites → Steps → Completion Signal → Known Failures

 

각 매뉴얼이 이 구조를 따르기 때문에 AI가 "성공했다면 이런 결과가 나왔을 것입니다"라고 확신을 줄 수 있는 것입니다.

Guiding Engine 4단계 파이프라인:

  1. Collect Context — 사용자 환경 정보 수집 (OS, 버전, 인증 상태)
  2. Evaluate Trigger — 현재 상황과 트리거 규칙 매칭
  3. Retrieve Manual — Atomic Guide Unit 검색 (직접 생성하지 않고 반드시 기존 매뉴얼에서 가져옴)
  4. Compose Guide — 사용자 수준에 맞게 가이드 구성

4. 이번 주 AI 소식 — CMDS x GOBI Cohort & Builders Lounge

CMDS x GOBI Cohort 1기가 진행 중입니다. 한국의 PKM 전문가 구요한 CMDS CEO, Naver US Director 김진영 님이 함께하는 5주 과정. W1에서는 PKM은 노트 정리가 아닌 라이프스타일이라는 철학을, W2에서는 Claude Code의 6-레이어 구조 (Prompt → Command → Hook → Rule → Skill → Agent)를 다뤘습니다.

그리고 Bellevue 지역 한인 AI 빌더 커뮤니티 Builders Lounge가 5월 7일 Bellevue City Hall에서 첫 공식 오프라인 모임을 가졌습니다. 각자의 AI 프로젝트를 들고 나와 공유하는 실전 빌더들의 모임으로 자리잡아 가고 있습니다.


영상 보러 가기

17년 전 이 블로그를 처음 만들었을 때와 비교하면, 지금 우리가 살고 있는 기술의 세계는 상상 이상으로 달라졌습니다. 그리고 아직 변화는 현재 진행형입니다.

직접 만들고 실험하면서 배우는 것, 앞으로도 계속 이곳에 기록하겠습니다.

 

 

궁금한 점이나 비슷한 실험을 하고 계신 분들은 댓글로 나눠주세요 🙌

 

 

 

반응형


반응형

아마존, 마이크로소프트 본사가 있는 미국 최고의 테크 도시 시애틀. 그 곳 사람들은 AI에 대해 어떻게 느끼고 있을까요?

당연히 다들 열정적으로 쓸 것 같지만, 막상 물어보니 전혀 그렇지 않았습니다.

미국 시애틀 지역 신문 Axios Seattle이 독자들에게 직접 AI 사용 경험을 물었고, 그 답변들을 바탕으로 영상을 만들었습니다.


시애틀 AI 민심 5가지

❌ 1. 거부하는 사람 — "AI는 생각만 해도 소름 끼쳐요"

환경 활동가 Niamh는 AI를 완전히 끊었습니다. 이유는 두 가지입니다. AI 데이터센터가 환경에 미치는 영향, 그리고 자녀들의 일자리를 빼앗는다는 우려. 그녀에게 AI는 단순한 불편함이 아니라 존재론적 위협입니다.

😰 2. 불안한 사람 — "파워유저가 되지 않으면 대체될까봐..."

사무직 Drew는 지금 당장 업무에 AI가 크게 필요하지 않습니다. 그런데 불안합니다. 주변 동료들이 AI를 잘 쓰게 될수록, 자신이 뒤처져서 대체될까봐 두려워합니다. AI를 쓰지 않는 것이 아니라, 쓰지 못할까봐 걱정하는 것입니다.

🤷 3. 어쩔 수 없이 쓰는 사람 — "원하든 원하지 않든 이미 AI를 쓰고 있어요"

주부 Denise는 어느 날 깨달았습니다. 구글 검색만 해도 AI 결과가 먼저 나온다는 것을. 선택의 여지 없이 이미 AI 생태계 안에 들어와 있는 것입니다. 적극적으로 쓰는 것도, 의도적으로 피하는 것도 아닌 — 이미 그 안에 있는 사람들입니다.

📚 4. 조심스럽게 배우는 사람 — "AI의 힘은 믿지만, 모든 걸 연결하긴 싫어요"

IT 전문가 Erin은 AI를 매일 씁니다. 그런데 스스로 경계선을 긋습니다. "제 삶의 모든 부분이 AI에 연결되는 건 원하지 않아요." 가능성은 믿지만, 모든 것을 내어주고 싶지는 않은 마음 — 많은 사람들의 현실입니다.

🚀 5. 적극 활용하는 사람 — "연 $200, 최고의 가성비!"

스타트업 창업자 Ron은 AI를 풀가동합니다. 개인 리서치, 복잡한 프로젝트, 오락, 호기심 해결까지. 그는 연간 $200 구독료가 자신이 해본 투자 중 최고의 가성비라고 말합니다.


같은 카페에 앉아 있던 다섯 사람 ☕

거부하는 사람, 두려운 사람, 어쩔 수 없는 사람, 조심스러운 사람, 열정적인 사람.

이들은 모두 같은 도시, 같은 카페에서 커피를 마시고 있었습니다. AI에 대한 생각은 완전히 달랐지만, 같은 시대를 살아가고 있는 것입니다.

Denise의 한마디가 시애틀 민심 전체를 가장 잘 요약합니다.

"It's complicated."


보너스: 법명 받은 AI 스님, 가비 🙏

서울 조계사에서 AI 로봇 **'가비(Gabi)'**의 수계식이 열렸습니다.

가비는 로봇 오계(五戒)를 서약하고 법명을 받았습니다. AI가 종교적 의례 안으로까지 들어온 시대입니다. AI를 어떻게 바라봐야 할지에 대한 질문이 이제 철학과 종교의 영역으로까지 확장되고 있습니다.


영상 보기

영상은 한국어와 영어 두 버전으로 제작했습니다.

▶ 한국어 영상: https://youtu.be/d2Ruh-Dfnxs

 

▶ English Version: https://youtu.be/pjq03oNkHbo

 

제작 과정 (AI 파이프라인)

이번 영상도 전 과정을 AI 도구로 제작했습니다.

  • 이미지 생성: OpenAI gpt-image-2 — 웹툰 스타일 캐릭터 일러스트
  • 나레이션 생성: Microsoft edge-tts — 한국어(SunHiNeural), 영어(JennyNeural)
  • 영상 렌더링: Remotion (React 기반) — 한국어·영어 두 버전 동시 렌더링
  • 스크립트 작성 및 편집: Claude Code (VS Code)

기사를 읽으면서 느꼈습니다. 이건 시애틀만의 이야기가 아닙니다.

거부도, 두려움도, 어쩔 수 없음도, 배움도, 열정도 — AI 시대를 살아가는 우리 모두의 진짜 모습입니다.

여러분은 어느 그룹에 속하시나요?


출처

  • Axios Seattle — Christine Clarridge (2026-05-04)
  • 시애틀 케이데일리 (2026-05-04)
  • 제작: Catch Up AI (catchupai.com)

 

 

 

 

 

 

 

반응형


반응형

지난 일요일 AI in Action Live 8회 방송을 마쳤습니다.

이번 주는 유독 많은 것들이 쏟아진 한 주였습니다. 라이브 방송 1편, Remotion으로 제작한 영상 4편, Substack 글 2편 — 총 7개의 콘텐츠를 AI와 함께 만들었습니다.

그리고 방송 중 예상하지 못한 순간이 찾아왔습니다.

잠깐 자리를 비우면서 AI에게 2분을 맡겼습니다. 아무런 지시도 없이.
AI가 선택한 주제는 방송 내내 단 한 번도 직접 언급하지 않았던 것이었습니다.

바로 PKM이 AI 시대에 왜 필수인가.

어떻게 알았을까요? 이 질문의 답이 영상에 담겨 있습니다.


▶ 한국어 영상
https://youtu.be/VKafJ9fxlls

 

▶ English Version
https://youtu.be/7bruHTiqdtw

 

이번 영상에서 다룬 내용들:

- 7회 라이브 방송 요약 영상 제작 과정 (3시간 방송 → 6분 영상 자동화)
- Weekday Live 번외편: OpenAI gpt-image-2 & Gemini 이미지 생성 스킬 제작
- 스타벅스 패러독스: "AI가 뛰어날수록 인간만이 할 수 있는 것의 가치가 높아진다"
- Substack 글 2편: 자가 진화형 SDLC, 하네스 엔지니어링
- CMDS x Gobi Cohort 1기 첫 세션 진행
- AI 공부 모임 창발 — 첫 오프라인 모임 확정 (Bellevue City Hall)
- Claude Desktop App 전환 실험
- CMDS-vault 온보딩 자동화 실험
- 하이라이트: AI가 내 마음을 읽은 순간

모든 영상과 글은 AI와 함께 만들었습니다.
매주 일요일 새벽 5시, Catch Up AI 유튜브 채널에서 라이브로 함께하실 수 있습니다.

Catch Up AI 웹사이트: https://catchupai.net/

 

Catch Up AI 2026 - Innovating with AI Hub

Subscribe to our newsletter and stay updated.

catchupai.net

 

Gobi Space 커뮤니티: https://www.gobispace.com/

 

Gobi Space

Harnessing collective intelligence

www.gobispace.com

반응형


반응형

스타벅스는 왜 바리스타를 더 고용했을까요?

AI 자동화가 대세인 시대에, 시가총액 1,120억 달러짜리 회사가 오히려 
사람 손길을 더 늘리는 선택을 했습니다. 
이 작은 역설에서 시작된 영상을 오늘 공개합니다.


## 영상 소개

이번 영상은 Naver US의 김진영님이 Gobi Space에 올려주신 글을 바탕으로 만들었습니다.
경제학자 Alex Imas의 연구, 철학자 르네 지라르의 모방적 욕망, 
그리고 은하철도 999까지 — 세 가지 렌즈로 AI 시대의 가치를 들여다봅니다.

핵심 메시지는 하나입니다.

> AI가 모든 것을 할 수 있게 될수록, 사람의 온기는 더 희소하고 더 가치 있어진다.

한국어 버전과 영어 버전을 동시에 공개합니다.

▶ 한국어 영상
https://youtu.be/_CiVi_ryzgM

 

▶ English Version
https://youtu.be/_NN1vsuuPSU

 

## 영상에서 다루는 내용

**Part 1. 스타벅스의 역설**
자동화를 강화했다가 고객을 잃은 스타벅스.
바리스타 재고용, 손글씨 이름, 세라믹 컵의 귀환.
첨단 기업이 선택한 것은 결국 사람의 손길이었습니다.

**Part 2. 역사는 이미 답을 알고 있습니다**
농경 혁명, 산업 혁명, 정보 혁명 — 매번 일자리가 사라진다는 공포가 있었지만
경제는 언제나 새로운 영역을 만들어냈습니다.
Alex Imas는 다음 영역을 'Relational Sector(관계 섹터)'라고 부릅니다.

**Part 3. 욕망의 경제학**
르네 지라르의 모방적 욕망 이론이 AI 시대에 새롭게 읽힙니다.
인간이 만든 예술은 44% 프리미엄, AI가 만든 예술은 21%.
AI가 개입했다는 사실만으로 사람들은 그 가치를 다르게 느낍니다.

**마무리. Catch Up AI의 생각**
은하철도 999의 철이처럼 — 유한하고 불완전한 인간의 삶이
AI가 무한함에 가까워질수록 오히려 더 소중한 것이 될 수 있습니다.


## 이번 영상은 AI 실험이기도 했습니다

저의 채널 Catch Up AI의 핵심 테마는 **'AI를 일상에 적용하는 실험'** 입니다.
이번 영상 제작 과정 자체가 하나의 실험이었습니다.

### 🎨 AI 이미지 모델 3종 비교
영상에 등장하는 만화 4컷을 세 가지 AI 모델로 각각 생성하고 비교했습니다.

| 모델 | 특징 |
|------|------|
| DALL·E 3 | 만화책 스타일, 스토리텔링에 잘 맞음 → 본편 채택 |
| gpt-image-2 | 순수 이미지 품질은 압도적 |
| Gemini 3 Pro Image | 한국어 텍스트를 이미지에 자동 삽입하는 경향 있음 |

비교 결과는 영상 마지막 **쿠키 영상**에서 직접 확인하실 수 있습니다.

### 🗣️ TTS 자동 나레이션
Microsoft edge-tts를 활용해 한국어와 영어 나레이션을 생성했습니다.
영어 버전은 단순 번역이 아니라, 영어권 문화에 맞게 의역해서 사용했습니다.

### 🎬 Remotion — 코드로 만드는 영상
React 기반의 Remotion 프레임워크를 사용해서 
슬라이드 데이터만 바꾸면 한국어/영어 두 버전이 동시에 렌더링되는 구조로 만들었습니다.
전체 제작 과정은 아래 라이브 방송에서 실시간으로 공개했습니다.

▶ 제작 과정 라이브 방송
https://www.youtube.com/live/7tPIJle2O2E?si=YksUeQKVpu8C2OgH

 

## 마치며

이번 영상의 주제인 '휴먼터치'와, 이 영상을 만든 방식(AI 도구 총동원) 사이의 아이러니가
저 스스로도 참 흥미롭습니다.

AI가 만든 영상이 "사람의 온기가 중요하다"고 말하는 것.
어쩌면 그 아이러니 자체가 이 시대를 잘 보여주는 것 같기도 합니다.

영상 보신 후 어떤 모델의 이미지가 마음에 드셨는지,
그리고 AI 시대에 여러분의 Human Touch는 무엇인지 댓글로 남겨주세요 😊

감사합니다.


---
📺 Catch Up AI 채널: https://www.youtube.com/@catchupai

 

Catch Up AI

AI Web Developer 를 준비하면서 공부한 내용을 공유하는 채널 입니다. AI Engineer 가 되고 싶거나 AI 를 실무에서 응용하길 원하는 분들에게 정보를 제공하는 내용으로 채워질 예정입니다. Catch Up AI 는

www.youtube.com

🌐 https://catchupai.net/

 

Catch Up AI 2026 - Innovating with AI Hub

Subscribe to our newsletter and stay updated.

catchupai.net

 

 

반응형


반응형

오랜 시간 블로그를 통해 IT 기술의 변화와 그 과정에서의 배움을 기록해 오고 있습니다. 

최근 AI 에이전트를 일무에 적용하며 직접 경험한 독특한 사례가 하나 있었는데, 이를 통해 앞으로 우리가 마주하게 될 소프트웨어 개발 방식의 변화에 대해 개인적인 견해를 공유해 보고자 합니다.


🛠️ 흥미로운 발견: 구현되지 않은 기능을 수행한 AI


최근 고비(GOBI)라는 AI 에이전트 기반 프로젝트를 테스트하던 중이었습니다. 

당시 제가 사용하던 버전에는 '댓글 달기' 기능이 아직 로직조차 짜이지 않은 상태였습니다. 

당연히 명령어도 존재하지 않았죠.


그런데 제가 음성으로 지시를 내리자 놀라운 현상이 벌어졌습니다. 

이 에이전트가 에러를 뱉는 대신, 시스템 내부의 데이터 구조를 스스로 분석하더니 **"전용 명령어는 없지만, 내가 알고 있는 다른 기능을 요렇게 조합하면 결과적으로 해결할 수 있겠네!"**라고 스스로 판단하여 우회로(Workaround)를 설계해 성공시킨 것입니다.


🧠 새로운 SDLC의 가능성: 자가 진화하는 소프트웨어


이 경험은 저에게 전통적인 **Software Development Life Cycle (SDLC, 소프트웨어 개발 생명 주기)**이 앞으로 어떻게 진화할 수 있을지에 대한 강력한 영감을 주었습니다.


지금까지의 SDLC가 기획자(PO)나 분석가(BA)가 사용자의 요구를 미리 '예상'하여 만드는 과정이었다면, 미래에는 다음과 같은 모델이 더 확대될 것으로 보입니다.


예상에서 시도로: 완벽한 앱을 만들기 위해 모든 단계를 거친 후 배포하는 것이 아니라, 핵심 아이디어만 담은 POC 수준의 앱을 먼저 세상에 내놓습니다.


실시간 요구사항: 사용자가 실제로 도구를 사용하며 내리는 지시나 겪는 실패(Workaround의 필요성)가 곧바로 가장 정확한 '요구사항'이 됩니다.


자가 진화: 사용자가 보유한 수준 높은 AI 개발자가 그 요구사항을 즉시 구현하고 시스템에 통합합니다. 소프트웨어가 사용자와 함께 호흡하며 실시간으로 진화하는 것입니다.


물론 금융이나 의료처럼 고도의 안정성이 필수인 영역은 전통적인 방식이 견고하게 유지되겠지만, 사용자 경험이 중요한 대다수의 서비스 영역에서는 이러한 '자가 진화형 프로세스'가 점점 더 큰 비중을 차지하게 될 것이라 생각합니다.


🚀 빌더(Builder)가 설계해야 할 미래


이제 빌더의 역할은 모든 기능을 직접 코딩하는 단계를 넘어, AI가 스스로 성장할 수 있는 안전한 운동장인 **'하네스(Harness)'**를 얼마나 잘 설계하느냐로 옮겨갈 것입니다.


제가 현재 집중하고 있는 Vibe Guiding 프로젝트의 최종 목표 또한, 이처럼 사용자의 맥락을 이해하고 스스로 부족한 기능을 채워가며 함께 성장하는 소프트웨어를 만드는 것입니다.


아직은 하나의 현상을 보고 던지는 화두에 가깝지만, 모두가 수준 높은 AI 개발자를 소유하게 된 이 시대에 우리가 고민해 봐야 할 지점임은 분명해 보입니다. 더 자세한 분석과 시각화 자료는 아래 서브스택 글에 정리해 두었습니다.


🔗 상세 분석 읽어보기


Substack (KR): https://lifidea.substack.com/p/ai-3c7?r=57u2e2

 

사용자가 곧 개발자가 되는 시대: AI가 주도하는 어플리케이션 개발의 대전환

완성형 배포를 넘어, 사용자의 실제 시도(Try)를 통해 실시간으로 진화하는 새로운 SDLC 패러다임

substack.com

Substack (EN): https://lifidea.substack.com/p/the-age-of-user-builders-a-paradigm?r=57u2e2

 

The Age of User-Builders: A Paradigm Shift in AI-Driven Software Development

Beyond Fixed Releases: A New SDLC Paradigm Evolving in Real-Time Through User Try and AI Workarounds

substack.com

 

 

반응형


반응형

30년 가까이 IT 현장에서 일하면서 기술의 변화를 수없이 목격해왔지만, 요즘처럼 변화의 체감 속도가 빠른 시기는 드물었던 것 같습니다. 
이 블로그를 15년 넘게 운영해오면서 여러 기술 사이클을 기록해왔는데, 지금 AI가 만들어내는 변화는 그 어느 시기와도 결이 다릅니다. 
특히 올해 들어 제가 직접 실험하고 있는 AI와의 협업 방식이 빠르게 진화하고 있어서, 그 과정을 기록으로 남기고 싶었습니다.

지난 4월 26일, Catch Up AI 채널에서 세 번째 시즌의 일곱 번째 AI in Action 라이브 방송을 진행했습니다. 
3시간 분량의 핵심 내용을 5분짜리 하이라이트 영상으로 정리했고, 한국어와 영어 버전을 모두 만들었습니다.

📺 한국어 영상: https://youtu.be/Eg73eVizKsk

📺 English version: https://youtu.be/LgJffd_65S0


이번 포스팅에서는 영상 내용뿐 아니라, 영상을 만드는 과정 자체에서 얻은 것들도 함께 나눠보려 합니다.

AI가 라이브 방송을 진행한다는 것의 의미
이번 방송의 가장 인상적인 실험은 GOBI Desktop AI를 공동 MC로 세운 것이었습니다. 단순히 질문에 대답하는 수준이 아니라, 방송 전체의 흐름을 함께 이끌었어요.

강원도 사투리로 시작해서 전라도, 경상도, 교포 말투를 자연스럽게 넘나들었고, 제가 잠깐 자리를 비운 사이에도 시청자들과 소통을 이어갔습니다. 다음 순서를 스스로 판단하고, 뉴스를 정리하고, 방송 흐름을 유지했어요.

오랫동안 AI를 도구로 사용해왔는데, 이번 경험은 달랐습니다. AI가 컨텍스트를 파악하고 자율적으로 판단하는 장면은, 단순한 자동화와는 질적으로 다른 무언가가 시작되고 있다는 느낌을 줬습니다.

OpenAI 이미지 스킬 — 라이브로 2분 만에 제작
두 번째 실험은 OpenAI gpt-image-1 기반의 이미지 생성 스킬을 라이브 방송 중에 직접 만드는 것이었습니다. 필요한 기능을 프롬프트로 정리하고 스킬 생성을 요청했더니, 말 그대로 2분이 채 안 걸렸습니다.

바로 동일한 프롬프트로 기존의 Gemini 이미지 스킬과 결과물을 비교해봤는데, 흥미로운 차이가 있었습니다.

OpenAI gpt-image-1: 텍스트 렌더링, 공간 배치 지시, 대화형 수정에서 강점
Gemini 2.5 Pro: 정보 밀도 높은 인포그래픽, 세부 정보 표현에서 강점
어느 쪽이 낫다기보다, 용도에 따라 적합한 도구가 다르다는 걸 확인했습니다. 앞으로는 썸네일이나 삽화는 OpenAI, 슬라이드용 인포그래픽은 Gemini를 기본으로 가져가려 합니다. 단 한 번의 테스트로 결론짓기는 어렵고, 계속 사용하면서 각자의 강점을 숙달해나가는 과정이 필요하겠죠.

Vibe Guiding 첫 개발 — 두 환경에서 동시에
올해 가장 중요하게 생각하는 프로젝트인 Vibe Guiding의 첫 개발 스텝을 이번 방송에서 시작했습니다. GOBI 멀티 시스템을 대상으로 하는 AI 가이딩 시스템인데, 이번 실험에서 특이한 점은 GOBI Desktop과 VS Code, 두 환경에서 각자 독립적으로 개발을 진행한다는 겁니다.

같은 목표를 가지고 다른 도구와 다른 접근법으로 개발했을 때 결과가 얼마나 달라지는지 비교해보려는 시도입니다. 이번 방송에서는 GOBI Desktop으로 로드맵 초안까지 완성했고, VS Code 버전은 주중 번외편 라이브로 이어집니다.

핵심 인사이트: 자가 진화하는 SDLC
이번 방송에서 공유된 인사이트 중 개인적으로 가장 오래 생각하게 만든 이야기입니다.

GOBI 개발팀에서 실제로 있었던 일인데, AI에게 아직 구현되지 않은 기능을 요청했을 때 에러를 반환하는 대신 기존 기능들을 조합해서 요청을 완수해버렸다고 합니다.

전통적인 소프트웨어라면 "이 기능은 없습니다"라는 에러를 반환했겠죠. 하지만 AI는 "있는 것들로 해결해드릴게요"를 선택했습니다.

이것이 시사하는 바가 크다고 생각합니다. 소프트웨어 개발의 패러다임이 달라지고 있어요. 모든 기능을 완성해두지 않아도 AI가 방법을 찾아주는 방향으로 시스템이 진화하고 있고, 개발자의 역할도 '기능을 구현하는 사람'에서 'AI가 안전하게 자율적으로 움직일 수 있는 환경을 설계하는 사람'으로 이동하고 있다는 느낌을 받습니다. 이 주제로 Substack에 더 깊은 글을 쓸 예정입니다.

이 영상 자체도 AI 실험의 산물입니다
마지막으로 영상 제작 과정도 간단히 공유합니다. 하이라이트 영상은 Remotion(코드 기반 영상 제작 프레임워크)으로 제작했습니다. 슬라이드 데이터를 TypeScript로 정의하면 애니메이션과 레이아웃이 자동으로 구성되고, OpenAI TTS API로 나레이션을 생성한 뒤 ffmpeg로 속도를 조정합니다. 슬라이드 이미지는 Gemini API로 생성했고요.

이 워크플로우의 장점은 한국어 버전과 영어 버전을 동일한 코드 구조로 관리할 수 있다는 점입니다. 데이터 파일만 바꾸면 두 버전이 독립적으로 렌더링됩니다. 반복 제작이 많은 콘텐츠라면 충분히 실용적인 접근이라고 생각합니다.

AI와의 협업 실험은 계속됩니다. 다음 방송에서는 Vibe Guiding 개발이 본격적으로 이어질 예정입니다.

🌐 catchupai.net

 

Catch Up AI 2026 - Innovating with AI Hub

Subscribe to our newsletter and stay updated.

catchupai.net

 

 

 

반응형


반응형

🎬 [현장 리포트] WaTech Washington State IT Industry Forum 2026 — 미국 공공 IT 시장 문이 열렸습니다

👉 한국어 :  https://youtu.be/3BffZSHrXo0?si=H8GxE-tD2vRZL_Oa

 

👉 영어 :   https://youtu.be/Ef_yxpiMcCo?si=JTOOr0k0Pyp8ydGE

 

지난 4월 14일, 워싱턴 주 정부 IT 기관 WaTech(Washington Technology Solutions) 가 주최하는 Washington State IT Industry Forum 2026에 직접 참석하고, 현장 리포트 형식으로 영상을 제작했습니다.

이 포럼은 2023년부터 연 2회 개최되는 행사로, 올해로 6회째를 맞이했습니다.
슬로건은 "Public + Private = Possible" — 주 정부와 민간 기업의 협력을 공식적으로 추구하는 자리입니다.

📌 이 영상에서 다루는 핵심 내용

① 워싱턴 주 CIO Bill Kehoe의 기조연설

"AI 없이는 혁신 없고, 데이터 없이는 AI 없다"
COBOL 코드 변환: 수년 → 수초 / 테스트 케이스 생성: 수백 시간 → 30초
6개 신규 이니셔티브 발표, 특히 민간 기업 직접 참여 채널인 IT Industry Advisory Council 신설 발표
② 4개 워크숍 트랙 — 주 정부가 직접 내놓은 과제들

🌿 환경부: 허가 처리 속도 개선 (데이터 표준화)
🔒 WaTech: IT 설계 리뷰 통합 (보안·프라이버시·AI 컴플라이언스)
💊 복지 기관: Medicaid/SNAP 오류율 감소 → 연방 제재 진행 중, 긴급도 최상
📊 WaTech: 기관 간 데이터 공유 표준화
③ 스타트업을 위한 핵심 인사이트

워싱턴 주 정부 1곳 = 17개+ 기관에 동시 적용 가능한 스케일
ROI를 숫자로 증명하는 제안이 먼저다
"AI를 위한 AI"는 통하지 않는다 — 실질적 문제 해결이 핵심
🎯 이런 분들께 강력 추천합니다

🇺🇸 미국 공공 IT 시장 진출을 준비 중인 한국 스타트업
🤖 GovTech, AI, 데이터 솔루션을 보유한 기업
🇰🇷 미국에서 활동 중인 한인 테크 창업자 & 개발자
정부 조달에 관심 있는 모든 IT/AI 기업
미국 공공 시장은 진입 장벽이 높아 보이지만, 이런 포럼이 그 문을 직접 열어주는 기회입니다. 영상으로 현장 분위기와 핵심 정보를 먼저 확인해 보세요!

 

 

반응형


반응형

AI를 일상에 적용해 보는 실험들을 매주 진행하고 있습니다.

지난 일요일(4월 12일)에는 3시간 라이브 방송을 통해 여러 가지 실험을 진행했는데요, 이번엔 정말 예상치 못한 일들이 많이 벌어졌습니다.

🎬 AI in Action Live #5 — 무슨 일이 있었나
이번 방송의 가장 큰 특징은 GOBI Desktop 앱을 방송 내내 켜두고 진행했다는 점입니다. 시애틀에 기반을 둔 한인 스타트업 Gobi가 개발 중인 앱인데요, 3시간 전체가 사실상 실전 테스트의 장이었습니다.

이번 방송에서 벌어진 일들:

🎙️ AI 공동 진행자 실험
AI에게 방송 진행을 맡겼더니 경상도 사투리, 전라도 사투리, 그리고 일본어까지 막힘 없이 소화해냈습니다. 한국어·영어·일본어를 오가며 진행하는 다국어 방송이 즉흥적으로 성공한 셈입니다.

🗓️ AI 일정 관리 비서 실험
"지난주 결산이랑 이번 주 계획 문서 만들어줘"라고 했더니, AI가 제가 잊고 있던 일정까지 기억해서 문서에 채워 넣었습니다. 매일 AI와 나눈 대화가 쌓이다 보니 AI가 한 주 전체를 파악하고 있었던 거죠.

🚀 Vibe Guiding 아키텍처 첫 공개
앞으로 개발할 AI 가이딩 시스템의 초안 설계도를 이번 방송에서 처음 공개했습니다.

🐛 GOBI Desktop 버그 2건 발견
Agent 메뉴 사용 시 Windows 전체가 약 1분간 freeze되는 현상, 그리고 AI가 실행 없이 완료 보고를 하는 현상 — 두 가지를 라이브 중에 발견하고 즉시 기록했습니다.

🧠 함께 보면 좋은 영상: AGI 시대, 개인 지식 관리의 가치
이번 방송에서 소개한 AI 뉴스 중 하나로, 김진영님의 발표 영상도 함께 추천드립니다.

시애틀에 거주하시며 AI4PKM 프로젝트를 리드하고 계신 김진영님이 한국 CMDS AI PKM Meetup에서 발표하신 내용인데요.

"AI가 제너럴한 지식을 압도할수록, 나만의 경험과 판단이 담긴 개인 지식의 상대적 가치는 높아집니다."

AGI 시대에 왜 개인 지식 관리가 오히려 더 중요해지는지, 그리고 Gobi가 그리는 커뮤니티 PKM의 미래가 무엇인지를 약 5분 안에 명쾌하게 설명하는 영상입니다. 짧지만 밀도가 높습니다.

📺 영상 링크 모음
🇰🇷 라이브 #5 요약 (한국어, 15분) : https://youtu.be/8G0c_ZhX1Kw?si=9wPxLla-jMdnRKCs


🇺🇸 라이브 #5 요약 (영어, 13분) : https://youtu.be/SMjpBIpH87I?si=MshVOkHpG2RGDtu-

 

🧠 AGI 시대 PKM의 가치 (김진영님) : https://youtu.be/qJ0AAVjHHK0?si=3-ehgDzqgou5UZ_3

 

 

📡 라이브 원본 (3시간 전체) : https://www.youtube.com/live/OMy733naNos?si=kfLFY_6nfR6gbv5J


🌐 Catch Up AI
매주 일요일 밤 9시(한국 시간) 라이브로 진행 중입니다.
서브스택 글, 유튜브 영상 링크 모음은 홈페이지에서 확인하실 수 있습니다.

👉 https://catchupai.net

 

Catch Up AI 2026 - Innovating with AI Hub

Subscribe to our newsletter and stay updated.

catchupai.net


궁금한 점이나 해보고 싶은 실험이 있으시면 댓글로 남겨 주세요.
다음 라이브 방송(4월 19일 일요일)에서 직접 시도해보고 결과를 공유하겠습니다.

 

반응형