KI Testcase - Innsbruck aus der Vogelperspektive

KI Testcase - Innsbruck aus der Vogelperspektive

Wer sich heute im Internet bewegt, muss sich gut festhalten, um nicht von der Flut an KI-generierten Inhalten davon gespült zu werden.
Beziehungsdramen animierter Katzen, Power-Washer, die uns die Regierung vorenthalten will, und natürlich Tai-Chi Walking.

KI ist ein mächtiges Werkzeug, das es vereinfacht, schneller und einfacher optisch hochwertige Bilder zu produzieren.
Und was es ermöglicht, massenhaft generischen Schwachsinn zu erzeugen, muss in den richtigen Händen auch zu besseren Filmen führen können.

So kam uns vor einigen Tagen spontan die Idee zu einem kleinen Testcase-Film
– Streetstyle-Interviews mit Twist.

Was und wer ist typisch Innsbruck?
Wer sind die typischen Charaktere, die man in unserer Heimatstadt kennt und liebt?
Studenten, begeisterte Bergsportler, Künstler – eine lange Liste.

Und was ist typischer für eine Stadt als die fliegenden Bewohner, die man auf jedem Platz und jeder Dachkante trifft.
Also - Innsbruck aus der Vogelperspektive.

Nach der Idee kam das Konzept und die ersten Fragen und Anforderungen.
Die Locations sollten möglichst original beibehalten werden.
Wie bewegen sich die Tauben? Wie sollen Mimik und Schnabelbewegungen funktionieren?
Wie werden die Modelle mit der deutschen Sprache umgehen? Welchen Workflow, welche KI-Modelle? usw.

Dazu gleich mehr - hier erstmal das Ergebnis: 

Und jetzt zur Umsetzung:

Locations – Back Plates:
Am Ende haben wir uns für einen hybriden Ansatz entschieden – sämtliche Locations wurden mit dem Handy handheld gefilmt, um von Anfang an den richtigen Look für die Streetstyle-Interviews zu erhalten.
2 Drehtage, 30 °C, knapp 40.000 Schritte und 1 Gewitter mit Blitzeinschlag unangenehm nahe an mir später war das erledigt.

Charaktere:
Nach einigen Tests habe ich mich für GPT-Image 2 zur Erstellung der Charaktere entschieden. Ein konsistenter Look war wichtig, aber mit etwas Ausprobieren war das richtige Prompt-Gerüst als Basis gefunden, auf das für jede Taube individuell aufgebaut werden konnte.
Das Erstellen der Tauben hat übrigens unerwartet viel Freude bereitet, und es gibt noch einige Entwürfe, die vielleicht etwas später ihre Zeit bekommen.

Animation:
Die Wahl des Modells war hier einfach – Seedance 2.0 war dank multimodaler Funktionsweise die beste Wahl, um gefilmte Backplates mit den in GPT-Image 2 erstellten Charakteren zu kombinieren.
Wie zu erwarten, lief das alles nicht wirklich reibungslos – es brauchte einige Versuche, bis die Tauben sich korrekt bewegten, und aus unerklärlichen Gründen wurde in einigen Generationen der Hintergrund von Seedance verändert – ich vermute, KI hat einfach auch mal einen schlechten Tag, irgendwie sympathisch. Ob es am guten Zureden lag oder einfach nur oft genug an der KI-Slot-Machine gezogen wurde, kann ich nicht sagen – aber irgendwann fanden Seedance und ich zueinander.
Bis auf die Sprache – während englische Tests kein Problem waren, scheiterte Seedance kläglich an den deutschen Texten.
Den typischen Innsbrucker Dialekt zu prompten wurde versucht, endete aber in – sehr lustigen – Fehlschlägen. In einer richtigen Produktion würden wir hier ohnehin nur mit echten Sprechern arbeiten wollen – also was soll's.

Text – Workaround:
Um dieses Problem zu lösen, musste ich auf ElevenLabs ausweichen und die Stimmen dort erstellen. Damit die Tauben später wieder lippensynchron sprechen, musste ich auf klassische Workflows im Edit ausweichen – das alte Handwerk wird also so schnell nicht irrelevant.

Produktionsdauer:
KI kann eine Produktion stark beschleunigen – wer der Meinung ist, dass ein paar Zeilen Text reichen, um wenige Sekunden später einen fertigen Film zu erhalten, liegt aber falsch. Von der Idee bis zum fertigen Film sind hier ca. 7 Arbeitstage vergangen, das ist allerdings immer noch sehr schnell.


Und was haben wir gelernt? 

KI macht vieles möglich. Nie war es einfacher, den Production Value zu erhöhen, und Ideen, die vor einigen Jahren noch schwer umzusetzen oder schlicht nicht zu finanzieren waren, sind plötzlich greifbar.
Wer die Technik so einsetzt, dass sie einen Mehrwert liefert, hat gute Chancen, Content zu erstellen, der aus der Masse jener heraussticht, die sie nur dazu verwenden wollen, Kosten zu sparen.

Die kommenden Regeln des EU AI Acts werden den Markt vermutlich nochmal verändern – aber KI, richtig eingesetzt, wird ein nützliches Tool bleiben, das hoffentlich zahlreiche talentierte Filmemacher dabei unterstützt, auch große Ideen umzusetzen.

Das Schönste am Filmemachen sind die kleinen Zufälle, Fehler und Probleme, um die entweder herumgearbeitet werden muss oder die eine Szene unerwartet besser machen.
Diese sind (zumindest aktuell) bei der Arbeit mit KI noch ausreichend vorhanden – so hat eine Taube schon mal eine ungeplante Performance hingelegt, die dazu führte, dass die Szene dann einfach entsprechend angepasst wurde.
Sollte KI in absehbarer Zeit konstant „perfekte“ Ergebnisse liefern, besteht aber die Gefahr, dass genau dieses zufällige Rauschen, das in der Vergangenheit dazu geführt hat, dass Klassiker wie „Der weiße Hai“ so ikonisch wurden, verloren geht.

Wer in Zukunft Besonderes schaffen will, sollte also vermutlich mit beidem arbeiten – KI und echten Menschen.