반응형
블로그 이미지
개발자로서 현장에서 일하면서 새로 접하는 기술들이나 알게된 정보 등을 정리하기 위한 블로그입니다. 운 좋게 미국에서 큰 회사들의 프로젝트에서 컬설턴트로 일하고 있어서 새로운 기술들을 접할 기회가 많이 있습니다. 미국의 IT 프로젝트에서 사용되는 툴들에 대해 많은 분들과 정보를 공유하고 싶습니다.
솔웅

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

카테고리


반응형

미국에 온 지 17년이 됐습니다.

처음 이 블로그를 시작했을 때는 iPhone이 막 나오던 시절이었고, 클라우드라는 단어가 낯설던 때였습니다. 그 이후로 스마트폰 혁명, 소셜 미디어, 빅데이터, 딥러닝… 수많은 기술의 파도가 지나갔는데, 지금 제가 느끼는 건 그 어떤 때보다도 변화의 속도가 빠르다는 겁니다.

그 중심에 있는 AI. 그냥 쓰는 것을 넘어서, 직접 만들고 실험하고 기록하기 시작했습니다. 매주 일요일 AI in Action 라이브 방송을 진행하고 있고, 이번 9회 방송 요약 영상을 유튜브에 올렸습니다. 이 글에서는 영상에 담긴 주요 실험들과 그 과정에서 배운 것들을 공유합니다.


1. 영상 자체가 실험이다 — 완전 자동화 영상 제작 파이프라인

이번 AI in Action #9 요약 영상은 처음부터 끝까지 코드로 만들었습니다.

사용한 도구들:

  • Remotion: React 기반의 영상 제작 프레임워크. 슬라이드 하나하나를 TypeScript 컴포넌트로 작성하면 MP4로 렌더링됩니다.
  • Claude Code: 코드 작성, 구조 설계, 스크립트 교정까지 AI와 페어 프로그래밍으로 진행.
  • gpt-image-2: OpenAI의 최신 이미지 생성 모델. 27개 슬라이드 중 14장의 실사 이미지를 자동 생성.
  • edge-tts (Microsoft): 한국어 TTS 나레이션. ko-KR-SunHiNeural(여성)과 ko-KR-InJoonNeural(남성) 두 목소리로 전체 나레이션 처리.
  • Gemini gemini-3-pro-image-preview: 유튜브 썸네일 생성. gpt-image-2로 시도했을 때 한국어 텍스트 렌더링이 불안정해서 Gemini로 전환했는데 결과가 훨씬 좋았습니다.

스크립트 작성 → 슬라이드 코딩 → 이미지 생성 → 오디오 생성 → 영상 렌더링까지, 수동 편집 없이 자동화된 파이프라인으로 한국어 16분 57초, 영어 14분 59초 두 편을 완성했습니다.

제작 중에 겪은 버그들 (이런 내용이 실제로 더 배울 게 많습니다):

  • Python Pillow로 썸네일 텍스트를 합성했더니 이모지가 전부 □로 출력 → Malgun Gothic 폰트에 이모지 글리프가 없어서 발생. Gemini로 전환하면서 해결.
  • Gobi CLI로 커뮤니티 포스팅 시도했더니 HTTP 404 오류 → 설치된 버전이 v2.0.3이었고 API가 더 높은 버전을 요구. npm install -g @gobi-ai/cli로 v2.0.19 업그레이드 후 해결.
  • 포스트 내용이 중간에 잘리는 현상 → 텍스트 내 스마트 따옴표(", ")가 CLI 파싱 단계에서 문자열을 종료시켜 버림. 일반 따옴표로 교체 후 정상화.
  • 커뮤니티 포스트에서 특정 항목 이후 글자에 취소선이 표시 → M1~M5처럼 범위를 표시하는 물결표(~)를 Gobi 마크다운 파서가 취소선 기호로 인식. -로 교체 후 해결.

이런 크고 작은 버그들을 하나씩 해결해 나가는 것 자체가 시스템을 더 단단하게 만드는 과정입니다.


2. 유타 프로젝트 — 도메인 전문가 + AI의 만남

시애틀에서 저, 유타에서 이선생님. 매주 목요일 화상통화로 진행하는 건강관리 앱 개발 프로젝트입니다.

이선생님은 한국과 미국에서 수십 년간 의료 공직에 계셨던 분으로, 본인의 전문 지식을 바탕으로 한 건강관리 서비스를 오랫동안 구상해 오셨습니다. 개발 경험은 전혀 없으시지만, 깊은 도메인 지식을 갖고 계십니다.

  • 7주간의 과정:

요구사항 정리 → 서비스 기획 → 웹 프로토타입 → 검증 → 현재: React Native 모바일 MVP 개발 중.

일반적으로 이 단계까지 오려면 전문 개발팀과 6개월 이상의 시간이 필요합니다. AI와 함께라면 이야기가 달라집니다.

원격 개발 협업에 사용한 기술 스택:

  • Expo Go: 앱스토어 출시 없이 실제 스마트폰에서 앱 테스트 가능
  • EAS Update (Expo Application Services): 시애틀에서 코드 수정 → 유타 스마트폰 앱 즉시 업데이트

비개발자가 AI와 함께 자신의 아이디어를 앱으로 만들어 나가는 이 실험 자체가 앞으로 많은 분들에게 참고가 될 것이라 생각합니다.


3. Vibe Guiding — AI 가이드의 다음 단계

이번 주 가장 집중한 실험입니다. M1 개념 정립부터 시작해 이번 주에 M2~M5를 한 번에 완주했습니다.

  • 기존 AI 챗봇과의 차이:

일반 AI 챗봇은 문서를 검색해서 방법을 알려줍니다. 하지만 이 사용자가 어떤 OS를 쓰는지, 현재 어떤 버전이 설치되어 있는지, 지금 정확히 어떤 오류 상태인지는 알지 못합니다.

Vibe Guiding은 사용자의 실제 환경을 읽고, 그 상황에 맞는 단계별 가이드를 제공하며, 완료 신호까지 안내합니다. "이 메시지가 나오면 성공한 것입니다" — 추측이 아닌 검증입니다.

Atomic Guide Unit 구조:

  • Goal → Prerequisites → Steps → Completion Signal → Known Failures

 

각 매뉴얼이 이 구조를 따르기 때문에 AI가 "성공했다면 이런 결과가 나왔을 것입니다"라고 확신을 줄 수 있는 것입니다.

Guiding Engine 4단계 파이프라인:

  1. Collect Context — 사용자 환경 정보 수집 (OS, 버전, 인증 상태)
  2. Evaluate Trigger — 현재 상황과 트리거 규칙 매칭
  3. Retrieve Manual — Atomic Guide Unit 검색 (직접 생성하지 않고 반드시 기존 매뉴얼에서 가져옴)
  4. Compose Guide — 사용자 수준에 맞게 가이드 구성

4. 이번 주 AI 소식 — CMDS x GOBI Cohort & Builders Lounge

CMDS x GOBI Cohort 1기가 진행 중입니다. 한국의 PKM 전문가 구요한 CMDS CEO, Naver US Director 김진영 님이 함께하는 5주 과정. W1에서는 PKM은 노트 정리가 아닌 라이프스타일이라는 철학을, W2에서는 Claude Code의 6-레이어 구조 (Prompt → Command → Hook → Rule → Skill → Agent)를 다뤘습니다.

그리고 Bellevue 지역 한인 AI 빌더 커뮤니티 Builders Lounge가 5월 7일 Bellevue City Hall에서 첫 공식 오프라인 모임을 가졌습니다. 각자의 AI 프로젝트를 들고 나와 공유하는 실전 빌더들의 모임으로 자리잡아 가고 있습니다.


영상 보러 가기

17년 전 이 블로그를 처음 만들었을 때와 비교하면, 지금 우리가 살고 있는 기술의 세계는 상상 이상으로 달라졌습니다. 그리고 아직 변화는 현재 진행형입니다.

직접 만들고 실험하면서 배우는 것, 앞으로도 계속 이곳에 기록하겠습니다.

 

 

궁금한 점이나 비슷한 실험을 하고 계신 분들은 댓글로 나눠주세요 🙌

 

 

 

반응형