텍스트만으로는 부족했다

7일차에 스토리 생성기를 완성하고 나서 휴대폰으로 직접 열어봤습니다.

그냥 텍스트뿐이었어요. 밋밋했습니다.

지킬 박사와 하이드 하나만 해도 장면마다 일러스트가 필요하니 최소 18개는 있어야 했습니다. 작가님께 의뢰하면 개당 510만원, 스토리 하나에 90180만원이 들겠더라고요. 스토리팩 10개 만들려면? 일러스트만 수천만원입니다.

사이드 프로젝트 규모를 완전히 벗어난 비용이었어요.

Gemini로 이미지 생성하기

메인으로 쓰는 Claude는 아직 이미지 생성을 지원하지 않아서 구글 Gemini를 알아봤습니다.

무료 티어가 넉넉해서 제가 쓸 정도로는 사실상 공짜였어요.

더 중요한 건, Gemini는 참조 이미지를 지원한다는 점이었습니다. 프롬프트에 예시 이미지를 함께 보내면 그 스타일을 따라 그려줍니다.

이게 핵심이었어요. 하이드가 장면마다 완전 딴 사람처럼 나오면 몰입이 깨지거든요. 일관성이 필요했습니다.

표지와 장면 이미지, 두 가지

필요한 이미지가 두 종류더라고요.

표지 이미지(1:1 정방형) - 책 표지처럼, 제목과 저자명이 이미지 위에 텍스트로 들어가는 것

장면 이미지(4:3 가로) - 각 노드마다 들어갈 일러스트레이션, 텍스트 없이

문제는 Gemini한테 “텍스트를 넣을 때”와 “빼야 할 때”를 이해시키는 거였습니다. AI 이미지 모델이 텍스트에 대해선 좀 이상하게 반응하더라고요. “텍스트 넣지 마”라고 하면 오히려 더 넣으려고 할 때도 있어서, 프롬프트에서 아주 명확하게 지시해야 했습니다.

파이썬 스크립트 제작

Claude 도움으로 파이썬 스크립트 두 개를 만들었어요.

generate_illust.py는 이미지 하나를 생성합니다. 표지든 장면이든.

generate_all_nodes.py는 스토리 JSON을 읽어서 모든 장면 이미지를 한 번에 생성합니다.

두 번째가 진짜 중요했습니다. 18개 넘는 이미지를 일일이 명령어 쳐가며 만들 수는 없으니까요.

# 이 명령 하나로 18개 장면 이미지가 자동 생성됩니다
python generate_all_nodes.py jekyll-and-hyde

지킬 박사와 하이드 전체 이미지 생성에 5~7분 걸렸습니다.

참조 이미지로 일관성 확보

핵심은 먼저 참조 이미지를 만드는 것이었습니다:

  • 스타일 가이드: 원하는 그림체와 색감을 보여주는 히어로 이미지
  • 캐릭터 레퍼런스: 지킬 박사, 하이드, 어터슨 각각의 개별 이미지

이 참조 이미지들 만드는 데 2시간 정도 투자했어요. 그러면 생성기가 장면 이미지 만들 때 자동으로 불러옵니다.

장면에 “지킬 박사”가 등장하면 스크립트가 DrJekyll.png를 참조 이미지로 로드해서 Gemini한테 “이 캐릭터 외모 맞춰줘”라고 전달하는 식이죠.

덕분에 일관성 문제가 해결됐습니다. 지킬 박사가 모든 장면에서 같은 모습으로 나오고, 전체적인 그림체도 통일감 있게 유지됐어요.

겪었던 문제들

프롬프트에 “텍스트 절대 넣지 마”를 여러 번 강조했는데도, 가끔 Gemini가 배경에 이상한 기호나 글자 같은 걸 그려넣더라고요. 약 5% 정도는 재생성이 필요했습니다.

그래도 재생성이 30초밖에 안 걸려서 큰 문제는 아니었어요.

처음엔 이미지를 하나씩 수동으로 생성했는데, 5번째쯤 되니까 미치겠더라고요. 그때 배치 스크립트의 필요성을 절감했습니다. 만드는 데 1시간 더 들었지만, 나중에 절약한 시간을 생각하면 충분히 가치 있었어요.

결과물

이제 휴대폰으로 What If Classics 스토리를 열면 모든 페이지에 일러스트가 있습니다. 그림체가 일관되고, 캐릭터가 장면마다 똑같은 모습으로 나오고, 텍스트 프로토타입이 아니라 제대로 완성된 제품처럼 느껴져요.

비용? Gemini 무료 티어 덕분에 0원.

다음은 성격 결과 화면 작업입니다. 사용자들이 소셜 미디어에 공유할 순간이니까, 특히 잘 만들어야겠죠.

다음 편에서 계속…