AI가 쌍둥이와 거인을 만들 때

배포 막은 치명적 문제

오만과 편견 스토리팩 배포 준비 끝. 장면 29개 생성, 엔딩 12개, MBTI 추적 완벽. 근데 최종 일러스트 검토하다가 충격.

무도회 배경 인물들이 전부 다아시랑 위컴이랑 똑같이 생겼어요.

엘리자베스 친구 샬롯은 고유한 조연이어야 하는데, 제인 베넷 복제품. 파티 손님들 얼굴 전부 똑같음. 빅토리아 공포 영화. 쌍둥이천지.

더 심각: 엘리자베스가 다른 사람보다 1.5~2배 컸어요. 거인 같았습니다.

몰입 완전히 깨지는 수준이었어요.

AI가 왜 이러는지

문제 #1: 쌍둥이 양산

제가 한 짓:

# 모든 장면에 전체 캐릭터 레퍼런스 다 때려박음
references = [elizabeth, darcy, jane, wickham]  # 4개 전부
scene_prompt = "무도회에서 샬롯이랑 얘기하는 엘리자베스"

AI가 이해한 것:

“캐릭터 디자인 4개 줬네. 이 무도회에서 어떻게든 써야지.”

AI가 한 짓: 레퍼런스를 적용할 수 있는 모든 사람한테 다 적용. 배경 인물, 파티 손님, 하인까지. 다아시 레퍼런스 봤으니 배경 신사가 다아시 얼굴. 제인 레퍼런스는 샬롯이 됨.

문제 #2: 거인 캐릭터

제가 쓴 프롬프트:

레퍼런스 이미지의 정확한 외모를 사용하세요.

AI 해석:

“이 레퍼런스 캐릭터들이 중요하구나. 눈에 띄게 만들자.”

결과: 레퍼런스 캐릭터를 더 크게, 더 지배적으로 만들어서 강조. 엘리자베스가 샬롯보다 1.8배. 다아시는 배경 손님들 위로 우뚝.

현실적인 인간 비율 명시 안 하니까 AI가 크기로 중요성 표현한 겁니다.

해결: 극도로 명시적인 프롬프트

AI 이미지 생성은 강박적인 수준의 구체성이 필요하더라고요.

수정 #1: 장면별 캐릭터 감지

이전: 모든 장면이 4개 캐릭터 레퍼런스 전부 받음

수정:

# 이 장면에 실제로 나오는 캐릭터만 감지
art_prompt = "함께 웃는 엘리자베스와 샬롯..."
detected = detect_characters_in_prompt(art_prompt, all_characters)
# 결과: ['elizabeth']만 감지

# 관련 레퍼런스만 전달
references = [elizabeth_reference]  # 엘리자베스만
excluded = [darcy, jane, wickham]  # 안 나오는 사람 명시

프롬프트 추가:

중요: 이 캐릭터들은 이 장면에 안 나옴: darcy, jane, wickham
- 배경 인물, 엑스트라를 이들처럼 보이게 만들지 마
- 장면의 다른 모든 사람(elizabeth 제외)은 완전히 다른 외모

수정 #2: 크기/비율 규칙 8개

현실적 인간 크기에 대한 명시적 규칙:

캐릭터 크기와 비율 (중요):
- 모든 인간 캐릭터는 서로 현실적으로 비례
- 주요 캐릭터는 일반 인간 크기, 거인처럼 보이면 안 됨
- 환경(문, 가구)에 맞게 적절한 크기
- 원근감 유지 - 먼 캐릭터는 더 작게
- 불균형하게 큰 캐릭터로 구도 지배 금지
- 일관된 현실적 인간 비율
- 같은 거리면 거의 같은 크기
- 배경 캐릭터는 거리 때문에만 작아야 함

레퍼런스 제약:

중요: 레퍼런스는 외모만, 크기 아님
- 레퍼런스 캐릭터는 일반 인간 크기
- 더 크게 만들거나 눈에 띄게 하지 마
- 얼굴 특징, 의상, 디테일에만 적용, 크기는 아님

수정 #3: “다중 엘리자베스” 방지

엘리자베스 레퍼런스만 쓰니까 새 문제: 같은 장면에 여러 명이 엘리자베스 외모.

추가:

중요: 이 장면에 중복 얼굴 없음
- 각 레퍼런스 캐릭터 외모를 가진 사람은 한 명뿐
- 한 캐릭터만 레퍼런스됐으면(elizabeth), 그 외모는 한 명만
- 다른 모든 사람은 완전히 고유하고 다른 얼굴
- 모든 사람은 다른 얼굴 특징 가진 고유 개인
- 동일하거나 쌍둥이 같은 얼굴 절대 금지

수정 #4: 캐릭터 디자인 구별

다아시랑 위컴 둘 다 어두운 특징의 “잘생긴” 남자. 의상만 다름(어두운 코트 vs 빨간 제복). 부족.

이전:

  • 다아시: 어두운 물결 머리, 강한 특징, 강렬한 눈
  • 위컴: 잘생긴 특징, 편안한 미소, 친근한 눈

수정:

  • 다아시: 어두운 물결 머리, 어두운 강렬한 눈, 강한 귀족적 특징
  • 위컴: 밝은 갈색 머리, 밝은 파란 눈, 부드럽고 친근한 특징

머리색+눈색 대비로 제복 없이도 즉시 구별 가능.

반복 테스트

1단계: 문제 장면 4개 테스트

  • ✅ 1/4 성공 (엘리자베스 단독)
  • ❌ 3/4 실패 (배경에 다아시)

학습: “배경에” 있는 캐릭터는 레퍼런스 쓰면 안 됨

2단계: 배경 레퍼런스 제거

  • ✅ 거인 문제 해결
  • ❌ 다중 엘리자베스 발생

학습: 한 문제 고치면 새 문제 생김. 고유성 제약 필요

3단계: “중복 얼굴 없음” 추가

  • ✅ 나아짐, 근데 쌍둥이 일부 남음
  • 전체 재생성 결정

전체 재생성: 29개 장면

  • 첫 실행 22/29 성공
  • 실패 7개 재시도 → 6개 더 성공
  • 마지막 1개 수동 수정
  • 결과: 29/29 완료

배운 것들

  1. 명시적이 암시적보다 나음 - AI가 맥락 이해한다고 가정 금지

  2. 부정 지시도 중요 - 할 일만 말하지 말고 하지 말 것도 말하기

    • “elizabeth만 레퍼런스 일치”
    • “darcy, jane, wickham은 안 나옴”
  3. 제약 계층화:

    • 일반 규칙 (모든 인간은 현실적 비율)
    • 특정 규칙 (레퍼런스는 외모만)
    • 중요 규칙 (중복 얼굴 없음)
  4. 엣지 케이스 테스트 - 명백한 케이스는 잘 됨. 엣지 케이스(배경, 먼 캐릭터)에서 터짐

  5. 빠른 반복 - 각 수정이 새 문제 드러냄. 빠른 반복이 핵심

  6. 캐릭터 디자인 중요 - AI는 성격만으론 구별 못 만듦. 시각 대비(어두운/밝은 머리, 다른 눈색) 필요

  7. 한 수정이 다른 걸 깸 - 항상 테스트

최종 결과

모든 수정 후:

  • ✅ 29/29 장면 성공
  • ✅ 모든 캐릭터 레퍼런스 올바름
  • ✅ 쌍둥이 없음
  • ✅ 현실적 인간 비율
  • ✅ 각자 고유
  • ✅ 다아시랑 위컴 명확히 구별

투자 시간:

  • 문제 발견: 30분
  • 수정 구현: 2시간
  • 테스트 반복: 3회
  • 전체 재생성: 16분
  • 총: ~3시간

가치 있었나? 당연. 품질 문제는 사용자 경험 파괴했을 겁니다.

더 큰 그림

AI는 강력한 도구지만 정확한 인간 지도가 필요합니다.

평범한 AI 콘텐츠랑 우수한 AI 콘텐츠의 차이는 프롬프트 엔지니어링 품질. 프롬프트 제대로 만드는 데 3시간 쓴 게 몇 주 수동 일러스트 작업 절약함.

공개 빌딩은 승리랑 도전 둘 다 공유하는 거예요. 오늘은 도전이었지만, 이걸 해결하면서 한 달 순항보다 AI 이미지 생성 더 많이 배웠습니다.


진행: Day 15/100 상태: 오만과 편견 스토리팩 배포 준비 완료 (29/29 장면) 다음: 프로덕션 배포, 전체 스토리 흐름 테스트