AI 영상 ‘불쾌한 골짜기’를 넘는 핵심 해법: 스토리로 마음을 설계하는 허준호 감독의 작업법
요즘 AI 영상이 너무 빨리 좋아지다 보니, 이상하게도 “기술은 멋있는데 감정은 안 와요” 같은 순간이 생기죠.
근데 오늘 글은 그걸 뒤집는 이야기예요.
허준호 감독이 말하는 결론은 단 하나예요.
AI가 ‘그럴듯하게 보이게’ 만드는 데서 끝내지 말고, ‘울림이 생기게’ 서사를 설계해야 한다는 것.
그리고 이 글에는 그 서사를 실제 작업 워크플로로 구현하는 방식(스토리보드+프롬프트+음성/연기/이어붙이기/툴 선택)까지 뉴스처럼 정리해드릴게요.
여기서 특히 중요한 키워드는 감정/서사/워크플로/툴(시네마틱 제작) 쪽으로 잡을게요.
1) 허준호 감독, ‘학교 맹글라’로 AI 영상도 영화제에서 통한다는 증거 제시
- 수상 규모: “공식 셀렉 포함 약 25개 영화제 수상” 언급
- 출품 시작 시점: “작년 11월부터” 본격 출품
- 수상 경로:
- 국내 공모전 →
- AI 분야 대표 격으로 꼽히는 크로마 어워드(상위권 언급) →
- 뉴욕/할리웃 등 국제 페스티벌(일반 영화제+AI 부문 혼합 구조)
핵심은 “AI 작품이면 덜 봐준다”가 아니라, 이제는 AI인지 알면서도 당당히 상을 받는 흐름이 생겼다는 점이에요.
2) ‘불쾌한 골짜기’의 실체: 가짜 느낌(Too AI)보다 ‘서사 부재’가 더 치명적
- AI의 불편한 계곡(불쾌한 골짜기)는 분명 존재
- 많은 사람/기업이 비교 시 “애니메이션 쪽을 고른다”는 관찰
- 이유:
- 실사(폰/얼굴/동작)가 아직 “가짜 같아서” 거부감 유발
- 너무 AI스러운 결과물은 ‘이질감’이 커짐
- 해법: 그 불편함을 서사로 풀어야 사람들이 감정을 따라온다
허 감독은 “기술이 불편함을 만들 수는 있어도, 마음을 움직이면 울림이 생긴다”로 정리합니다.
즉, 결과물의 인상만이 아니라 사람의 감정 동선을 설계해야 한다는 거죠.
3) ‘학교 맹글라’가 특히 오래 남은 이유: 발표 직후가 아니라 6개월 후에도 수상
- 허 감독은 기술 경쟁보다 스토리라인(서사)을 중심에 둠
- 그래서 단기간 유행으로 끝나기보다, 시간이 지나도 영화제에서 계속 통함
- 당시 분위기 대비 차별점:
- 다른 AI 영상은 우주/로봇/휴먼드 로봇 같은 소재가 많았던 시기
- 허 감독은 “사람 이야기”를 먼저 넣음
- ‘이민자 이야기’ 축(저출생/가족/정서와 연결되는 주제)로 공감 확보
여기서 중요한 건 “감성”이라는 말이 추상적이 아니라, 서사가 들어가면 감정 반응이 실제로 달라진다는 경험담이에요.
4) 독학에서 전문가형 워크플로로: ‘음성/가사/더빙 실패’가 오히려 교과서가 됨
- 독학 시작(작년 7~8월 언급)
- 초기 제약:
- 영상에 음성이 없던 시기
- 더빙을 해도 어설프고 영상 같지 않음
- 전환 전략:
- 노래를 넣기 위해 가사를 쓰고 대사처럼 구성
- 하나씩 실험하며 ‘공부’가 쌓이기 시작
이 과정이 결국 “AI 영상도 영화적인 요소 없으면 살아남기 어렵다”는 결론으로 이어졌다는 흐름이 나옵니다.
5) 허 감독의 제작 방식(요약): 기획→학습 데이터→스토리보드→툴 기반 생성→이어붙이기
- 기획/리서치: 감독/영화/소설/문장 학습을 위한 접근
- 프롬프트 구조화:
- 메타프롬프트를 두고 학습 내용을 한 번에 나오게 세팅
- 원하는 결과가 나오도록 템플릿화
- 프리비주얼(과거엔 촘촘하게):
- 초기엔 스토리보드를 세밀하게 짜는 방식이 핵심
- 하지만 최신 툴 발전으로 ‘필요도가 변함’
- 편집/사운드:
- 편집은 케퍼스 사용 언급
- 사운드는 AI 음원/사운드 툴 활용
- 배경음악 매칭 및 자막 구성
결론적으로 이건 단순 생성이 아니라, 콘텐츠 생산 파이프라인이에요.
6) ‘뮤직비디오처럼’ 보이지만, 사실은 서사가 ‘나레이션/대사’로 들어간 장르
- 작품은 뮤직비디오 느낌
- 차별점:
- 단순 노래-장면 매칭이 아니라
- 노래 자체가 나레이션/대사 역할을 함
- 그래서 화면만 봐도 이야기가 진행됨
허 감독은 실제로 노래가 훅을 강하게 만들어서, 결과물을 “한 컷”에서 “심취”하게 만든다고 강조해요.
7) 최신 툴 판도: ‘옴니 제작 패러다임(Omni)’과 캐릭터 연기/음성 일관성 경쟁
- 세대 변화:
- 기존: 이미지를 뽑고(프레임 생성) → 이어붙여 영상화
- 현재: 캐릭터/배경을 넣고, 툴이 알아서 연출·촬영·이어붙이기까지 처리
- 핵심 비교:
- 스토리보드가 ‘덜 필요’해진 게 아니라 역할이 바뀜
- 스토리보드는 전체 흐름을 잡되, 중간 장면 연결은 프롬프트/툴이 더 자연스럽게 해줌
- 카메라 무빙/워킹:
- 이전보다 훨씬 자연스러워져 “컷이 끊긴 느낌”이 줄어듦
- 음성/목소리 일관성:
- 한 영상에서 만든 목소리가 다른 장면에도 유지되는 방식 설명
여기서 독자가 체감해야 하는 포인트는 “기술이 좋아져서”가 아니라, 서사를 끝까지 밀어붙일 생산성이 생겼다는 거예요.
8) 툴 선택 가이드: 시덴스/클링/배우/그록/비오—용도별로 비용과 품질이 달라짐
- 시덴스 2.0:
- 해상도는 1080p 언급
- 특유의 느낌이 장점
- 가격(비용) 부담이 존재(영상 길이 기준)
- 클링:
- 캐릭터 ‘주체’를 정확하게 넣는 데 강점
- 옷/디테일이 잘 표현된다고 강조
- 광고/상업 영상에 많이 활용된다는 흐름
- 시스:
- 드라마/영화적인 작업에 주로 사용
- 배우:
- 음성/연기 쪽 툴로 언급(초기엔 배우 3.1이 음성 요소 담당)
- 가격이 예전엔 비쌌지만 현재는 상대적 변화 언급
- 그록 / 비오:
- 초보자에겐 그록 추천(월 플랜, 목소리/음악 생성, 옴니 형식 언급)
- 비오는 대안이지만 상대적으로 추천은 그록 쪽
- 가격 전략:
- 해상도(1080p vs 4K)와 요금제(standard/ultra)에 따라 단가가 크게 달라짐
- 초보는 연습용으로 더 저렴한 선택지가 유리
이 부분은 결국 “AI 영상의 시장화가 되면서, 제작비 최적화가 곧 경쟁력”이 된다는 신호예요.
9) ‘토글 가능한 일관성’이 서사의 완성도를 만든다: 이어붙이기 + 인물/목소리 유지
- 핵심 기능으로 이어붙이기 설명:
- 이전 영상의 컷이 자연스럽게 다음 영상으로 연결
- 카메라 무빙이 끊기지 않아 “연출된 영화처럼” 보임
- 인물 동작(행동의 연속성) 유지
- 목소리도 연결:
- 한 영상의 목소리를 다른 장면에 다시 등장시켜도 유지되는 방식
즉, AI가 “한 장면”은 잘 만들지만, 제작자 입장에서는 결국 “완결된 서사(여러 장면의 연속성)”가 중요해지는 겁니다.
10) 독특한 사례: ‘로봇 싸움’이 아니라 ‘부모의 감정’으로 설득하는 방식
- 허 감독이 실제로 보여준 사례(아들의 사이버트럭/안경 테마)
- 핵심 장치:
- 아이의 불편함/미안함(근시+안경 파손)을 ‘슈퍼히어로’ 감정으로 바꿔줌
- 결과적으로 “싸움 영상”이 아니라 “행복/안도”의 정서 서사가 중심이 됨
이 사례는 “AI 영상도 서사를 담으면 관객의 감정이 움직인다”를 가장 직관적으로 보여줘요.
다른 곳에서 잘 안 다루는 ‘가장 중요한 내용’만 따로 정리
- AI의 불편함을 없애려 하지 말고, ‘서사로 해석하게’ 만들어야 한다
- 툴 발전은 “장면 생성”에서 “영화처럼 이어지는 제작(연속성)”으로 경쟁의 축이 이동했다
- 뮤직비디오처럼 보여도, 노래가 나레이션/대사 역할을 해야 눈물 포인트가 생긴다
- 스토리보드는 사라진 게 아니라 ‘촘촘한 프리비주얼’에서 “전체 흐름+연결 프롬프트” 중심으로 역할이 바뀌었다
- 툴 선택은 취향이 아니라 비용/해상도/일관성(인물/목소리/카메라 무빙) 요구사항에 의해 결정된다
전하고 싶은 주요 내용(한 문장)
AI 영상으로 감동을 만들고 싶다면, ‘더 예쁘게’가 아니라 ‘더 이야기답게’ 설계해야 한다.
< Summary >
- 허준호 감독은 ‘불쾌한 골짜기(불편한 계곡)’를 기술로만 해결하려 하지 않고, 서사로 울림을 만든다고 강조함.
- ‘학교 맹글라’는 사람 이야기 중심으로 공감대를 만들었고, 출시 후 6개월이 지나도 영화제 수상이 이어지는 사례로 제시됨.
- 독학 과정에서 음성 제약을 넘기 위해 가사/대사/노래를 먼저 만들며 작업법을 축적함.
- 최신 툴은 ‘옴니 제작’ 성격이 강해져 카메라 무빙/이어붙이기/목소리 일관성이 자연스러워짐.
- 시덴스/클링/시스/배우/그록/비오 등은 목적과 비용에 따라 역할이 나뉘며, 초보는 비용 최적화가 중요함.
[관련글…]



