Последняя версия каждого кадра. Все scene anchors (дом, забор, газон, кусты, форма крокодила, угол камеры) сохранены через всю последовательность благодаря multi-ref подходу: каждый кадр генерится с двумя референсами — предыдущий accepted кадр + frame_01 (canonical anchor).





Стратегия: frame 1 генерится как T2I (без референсов). Frames 2-5 — I2I с двумя референсами:
1️⃣ Primary: предыдущий accepted кадр (контекст текущего состояния стройки)
2️⃣ Anchor: frame_01.png (canonical scene + crocodile shape constraint)
Каждый промпт полностью переписывает всю сцену с нуля (дом, забор, газон, угол камеры). Источник: AI Maskman + Grow with Dani + Salmaan Mohamed (3/15 гайдов сходятся на full-redescribe). Multi-ref с anchor — наша адаптация после первого review.
Из официальной доки Gemini: модель блендит до 14 reference images как unified context — нет «primary», все равны. Передача frame_01 как второго референса работает как shape-constraint, не давая форме крокодила «плыть» во время excavation phase.
Модель: gemini-3.1-flash-image-preview (Nano Banana 3.1) — $0.067 per image.
Aerial 70° drone shot, белый двухэтажный дом сверху, кедровый забор с двух сторон, газон с диагональными mowing stripes, силуэт крокодила в белой краске чётко виден. Все якоря сцены установлены чисто. 0 регенов.
Все anchors сохранены. CAT excavator в теле, Bobcat у головы, mounds свежей земли, tire tracks. 0 регенов.
🔑 Урок: описывай цель, а не «чего нет» (модель видит «BLUE»/«WATER» и использует их). + Multi-ref с frame_01 anchor усиливает эффект если canonical кадр уже не имеет конфликтующих элементов.
🔑 Урок: при смене lighting/времени суток новое состояние нужно описывать в самом начале промпта. + Multi-ref с frame_01 НЕ ломает lighting transition если предыдущий кадр уже задаёт нужный контекст.
Из 11 generations на 5 кадров: 3 ушли с первой попытки (frames 1, 2 + некоторые multi-ref повторы), 8 потребовали регенов (включая single→multi-ref upgrade). Multi-ref подход полностью устранил регены на финальной итерации.
refs=[previous_frame.png]refs=[previous_frame.png, frame_01.png] — frame_01 как canonical anchor
Frame 1 (canonical scene с outline формы) работает как shape-constraint, не давая форме «плыть» во время excavation/concrete phases. Bonus: если frame_01 не имеет конфликтующих элементов (воды, ночи), он косвенно помогает с состоянием.
"empty pool, NO water, no liquid, not filled""dry concrete basin with aluminum ladder leaning inside, dust on the floor, deep shadow cast inside the empty pit"
Модель видит токены «water», «filled» в тексте и использует их как присутствующие концепты, даже после «NO». Описывай что должно быть нарисовано.
"...same backyard...<200 слов сцены>... and the lighting is twilight""EVENING TWILIGHT BLUE-HOUR SCENE. The sky is cobalt blue... ...<потом сцена>"
aluminum ladder inside → значит pool пустойtile dust, plaster bags on grass → finishing stage, не filledwarm yellow rectangles in house windows → twilight, не middaytire tracks across the lawn → recent equipment activityorange flagging tape on stakes → outline phase, не excavation
Naming convention: 03_v1_singleref.png, 03_v2_multiref.png, финальная копируется в 03.png. Тогда галерея в отчёте показывает полную историю. В этой итерации первые регены frames 4 и 5 потеряны — они помечены как «потерян» в галерее.
Frames 1, 2 прошли с первой попытки потому что переходы между ними не конфликтовали. Регены нужны только когда новое состояние радикально отличается от ref:
Total estimate для оставшихся 5 storyboard'ов: ~$2.00. Cumulative: ~$2.74.