Vom Hype zum Handeln

#25 Content mit KI - Warum Prompts allein nicht reichen

Episode Summary

In dieser Folge von „Vom Hype zum Handeln“ spricht Petra Liebl mit Manuel Diwosch, Gründer der Agentur Klickbeben, darüber, wie sich Contentproduktion durch KI verändert hat – und warum gute Inhalte mehr brauchen als nur ein paar Prompts. Im Mittelpunkt stehen Text-, Bild- und Videoinhalte: Was funktioniert heute tatsächlich mit KI-Tools, wo liegen ihre Grenzen und welche Rolle spielen Marketingerfahrung, Anwendungs-Knowhow und ein klarer Workflow? Anhand konkreter Beispiele aus der Praxis – von der Textproduktion über Bildgenerierung bis hin zu einem KI-generierten Werbevideo – zeigt das Gespräch, wie Inhalte heute Schritt für Schritt entstehen. Dabei wird deutlich: KI kann viele Produktionsschritte beschleunigen, ersetzt aber nicht das strategische Denken hinter wirksamen Inhalten. Entscheidend bleibt das Verständnis für Zielgruppen, Kundenfragen und funktionierende Marketingprozesse, die am Beispiel des Werbevideos besprochen werden. Unser Fazit: KI bietet mächtige Werkzeuge für die Content-Produktion – doch gute Ergebnisse entstehen nicht durch einen einzelnen Prompt, sondern durch Erfahrung, klare Prozesse und gezielte Steuerung von geeigneten Tools.

Episode Notes

Wie entstehen Inhalte mit KI – und warum reicht ein einzelner Prompt selten aus, um wirklich gute Ergebnisse zu erzielen?

EPISODE NOTES
Text, Bild und Video mit KI – warum Prompts allein nicht reichen
In dieser Episode spricht Petra Liebl mit Manuel Diwosch, Gründer der Agentur Klickbeben und Online-Marketing-Experte, darüber, wie sich Contentproduktion durch KI verändert hat – und was es tatsächlich braucht, damit Inhalte für ein Unternehmen wirksam sind.

Im Mittelpunkt stehen Text-, Bild- und Videoinhalte: Was funktioniert heute tatsächlich mit KI-Tools? Wo liegen ihre Grenzen? Und welche Rolle spielen Erfahrung, Marketing-Know-how und ein klarer Workflow?

Anhand konkreter Beispiele aus der Praxis – von der Textproduktion über Bildgenerierung bis hin zu einem vollständig KI-generierten Werbevideo https://www.instagram.com/p/DUimKiiDFO1/ – zeigt Manuel, wie Inhalte Schritt für Schritt entstehen. Dabei wird deutlich: KI kann viele Produktionsschritte beschleunigen, ersetzt aber nicht das strategische Denken hinter wirksamen Inhalten.

Darum geht’s in dieser Episode

Praxisbeispiele aus der Folge

Key Takeaways aus der Episode

Kapitel dieser Episode
00:00 Einführung: Content mit KI – Hype vs. Realität
03:40 Warum Marketingwissen weiterhin entscheidend ist
08:10 Prompt Engineering und iterative Prozesse
14:30 Bildgenerierung: Warum Details wie Licht und Perspektive wichtig sind
19:50 Von Bild zu Video – der typische KI-Workflow
25:30 Wie viel Arbeit hinter KI-generiertem Content steckt
30:00 Fazit: KI als Werkzeug im Marketingprozess

Zentrale Botschaft
KI kann die Contentproduktion deutlich erleichtern und beschleunigen. Doch wirksame Inhalte entstehen weiterhin durch Erfahrung, Marktverständnis und strategisches Denken. Nicht der Prompt allein entscheidet über den Erfolg – sondern das Wissen, das dahinter steckt.

Tools & Themen aus der Episode

🎙️ Gast in der Episode: Manuel Diwosch
Manuel Diwosch ist Online-Marketing-Experte mit rund zwei Jahrzehnten Erfahrung. Mit seiner Agentur Klickbeben https://www.klickbeben.com/ hat er bereits mehrere hundert Kundinnen und Kunden betreut – von kleinen Unternehmen über mittelständische Betriebe bis hin zu namhaften Konzernen.
Er unterrichtet an Unis und FHs, sein Skript zum Thema Online-Marketing ist seit 2015 auch als Buch erhältlich. Am WIFI hält er Kurse zu KI im Marketing.

🌐 Zusammenfassung der Episode
https://dertransformationspodcast.at/content-mit-ki-text-bild-video/

Episode Transcription

Willkommen zu einer neuen Folge von Vom Hype zum Handeln. Heute sprechen wir über ein Thema, das seit dem Siegeszug von Chat GPT und Co. überall gehypt wurde und wird, nämlich wie man Inhalte mit Hilfe von KI-Tools erstellen lassen kann. Früher brauchte man ein echtes Bild, ein Foto, ⁓ eine Geschichte mit Bild zu erzählen. Heute reicht mit etwas Erfahrung oftmals eine Handvoll Prompts im richtigen Tool. Möchte man meinen, zumindest wenn man auf Social Media oder LinkedIn liest, KI könnte man vermeintlich alles oder vieles auf Knopfdruck erstellen. Woher kommt diese Idee? Was geht wirklich mit zwei, drei Klicks oder zwei, drei Prompts? Und wofür braucht man viel mehr Erfahrung, Zeit und Know-how, damit gute Inhalte entstehen? Darüber spreche ich heute mit Manuel Diwosch. Manuel ist Online-Marketing-Experte mit rund zwei Jahrzehnten Erfahrung. Mit seiner Agentur Clickbeben hat er bereits einige hundert Kundinnen und Kunden betreut, dabei EBU, über mittelständische Unternehmen bis hin zu namhaften Konzernen. Seit mehr als zehn Jahren unterrichtet er an Unis und FHs und sein Skript zu Online-Marketing ist seit 2015 über Amazon auch in Buchform erhältlich. Am Wifi hält Manuel Kurse zu KI Marketing, damit haben wir eine Gemeinsamkeit. In dieser Folge sprechen wir beide darüber, wie sich Contentproduktion durch KI verändert hat, welche Erwartungen viele an KI Tools haben und welche davon realistisch sind. Hallo Manuel! Was meinst du, was braucht es heute denn wirklich, ⁓ mit KI richtig guten Content zu erstellen - und nicht nur, wie es die meisten machen, richtig VIEL Content.

Hallo!
Das Witzige ist ja, dass sich durch KI zwar die Produktionsgeschwindigkeit erhöht hat, die Produktionsqualität ja nur bei denen, die davor gar keine Qualität hatten, die gar nicht wussten, wo sie anfangen sollen, mehr oder weniger und gar keine Erfahrung hatten. Aber mit KI richtig guten Content zu stellen, braucht es wiederum die Expertise, die Branchexperten oder Online-Marketing-Experten haben, zu wissen, wenn man das macht, dann kann das funktionieren oder funktioniert aus diesen und jenen Gründen nicht, weil was die KI nicht automatisch hat, ist zu wissen, welche Kampagne davor funktioniert hat und welche nicht.

Da sprichst du von Kampagnen Wenn ich darf, bringe ich da ganz kurz noch meinen Blickwinkel rein, den du, glaube ich, ja mit angesprochen hast, sonst korrigiere ich Du man sollte wissen, was es braucht. Das nenne ich gerne Workflow. Es sind ja meistens mehrere Schritte bei Content-Erstellung man das auch ein Framework nennen, wie man denn das Copywriting so ansetzt. es gibt ja einiges an was man denken darf, und soll. ein bisschen aus der Wir sind beide im Online-Marketing uns, was man KI-Videoproduktion beachten muss. wäre mit dir aber ganz in Text und Bild zuvoreingestiegen und hätte das, was jeder schon probiert hat, dir gerne besprochen. dann aufs Video Bevor wir das jetzt tun, habe ich eine Frage an dich. oder eine App oder komplette Kampagne, weil du zuerst Kampagne erwähnt hast, die einfach so mit ein, zwei Bromps erstellt wurde und dann gleich fertig und perfekt war. Ich persönlich habe das noch nicht gesehen, aber vielleicht du schon.

Also ich behaupte, die gibt es auch zumindest noch nicht. Ich habe schon Webseiten gesehen, die mit einem Prompt erstellt wurden. Was denen fehlt an der Überzeugungskraft, an der technischen Struktur, an den Feinheiten, die es dann noch gibt, das ist noch mannigfaltig, sage ich jetzt einmal. Es ist aber natürlich eine gute Unterstützung. Wir haben ja im Vorfeld auch ein kleines Vorgespräch geführt und ich habe gesagt, ich sage immer, der Unterschied ist, die Erwartungshaltung ist ein Prompt, fünf Minuten, die Realität schaut aber für einen Experten, auch für den, der wirklich kann und der mit KI seit der ersten Stunde arbeitet, das sind jetzt doch schon ein paar Jahre, ist statt acht Stunden sind es vielleicht drei oder vier Stunden, es ist nicht statt acht Stunden vier Minuten oder drei Minuten oder vielleicht sogar noch ein paar Sekunden. Man muss ein bisschen aufpassen, weil man bekommt oft ein Blendwerk, das heißt, das sieht oft vielleicht einmal ganz gut aus, aber ein Experte, der Zahlendatenfakten dahinter vom echten Markt kennt, der weiß oft, naja, ganz so kann es nicht funktionieren, das ist mehr so, er hat von außen drauf überlegt.

Also was du uns den Zuhörern und mir jetzt erklärst, ist etwas, was er aus meiner Beobachtung teilen kann. Wenn ich mich in einem Bereich nicht auskenne, Installationen erstellt werden, dann kann man mir viel erzählen und werde erst danach feststellen, ob er es wirklich gut gemacht Ähnlich vielleicht bei der Webseite, da kriege ich dann was und es kann halt leider Passiert häufig, glaube ich, oder?

Genau, absolut. ist Handwerker finde ich von dir ein super Beispiel. Der eine sagt, kommt mit der Hilti XYZ und der nächste kommt mit der Bosch MD 47 und der sagt, der am Einverfahren ist das viel bessere, weil das ist ja mit der Bosch MD 47 und das andere sagt, das mit der Hilti XYZ und wir stehen eigentlich da und sagen, naja, wir haben ein Loch im Dach und womit du es jetzt fixen isst, ist eigentlich egal, Hauptsache. Das Dach passt nachher wieder und es funktioniert, dass wenn es regnet, es nicht mehr Das Problem ist, wenn das Tool, das Werkzeug das Beste ist, aber nachher trotzdem noch reinrinnt, gibt es ein ein Problem sozusagen. Und das ist so ein bisschen das, wo ich sage, da fehlt jetzt der KI noch zumindest an der Erfahrung. Beziehungsweise wie hast du es mal genannt, es wirkt sofort sehr eloquent. Das Problem ist, Das ist wie so ein Vortrag, der mit Fremdwörtern sich wirft, aber eigentlich gar keine Ahnung hat, was er tut. Da hat es einmal, ich glaube in Tirol.TV, weil wir in Tirol gerade sitzen, ein ganz witziges Werk gegeben von einem Redakteur, der ist auf den Wirtschaftskammerball, glaube ich, gegangen und hat einen Satz bespickt mit lauter Fremdwörtern am Politiker gestellt. wie man bei uns so ganz gern sagt in Österreich Großkopfertei. Dieser Satz hat mit so vielen Fremdwörtern überhaupt keinen Sinn ergeben und jeder hat aber ganz eloquent darauf wieder geantwortet und nur ein Einziger hat gesagt, dass er gibt überhaupt keinen Sinn, was sie da sagen. Nicht ganz so brachial, aber doch irgendwie so kann es oft wirken.

Ja, wenn wir da jetzt drauf einsteigen und sagen, was geht es denn beim Inhalte erstellen. Also weg von der ganzen Webseite mit sehr vielen Funktionen und gehen mal auf diese Teile, die wir dafür brauchen, auf Text und Bild und Video. Und das machen ja ganz viele Leute. bei der Abfrage, was Menschen mit KI machen, Texte oder bei Kommunikation, die E-Mails helfen lassen, ziemlich an erster In dem Sinne würde ich ganz gerne jetzt zwei, drei Sätze mit dir Text- und Bildgenerierung sprechen, bevor du uns über die Videos erzählst, was du dafür Erfahrungen gemacht Also in dem Sinne, wenn man jetzt einen guten Text erstellt, habe ich vielleicht schon davor einmal kurz erwähnt, bräuchte es ein Framework. Also was will man wirklich, damit man einen Zug zum Ziel hat. Also muss man wissen, wofür brauche ich denn diesen Text. Und wenn das jetzt eine Salespage ist, also etwas bestimmtes auf einer Webseite, das ein Ziel verfolgt oder nur informiert, sind das eben andere Dinge. Was ist denn da deine Erfahrung, wenn du sagst, jetzt Texte Schaffen das die meisten schon ganz gut oder sollte man da schon noch bisschen was dazu

Also wie gesagt, die, die vorher die ganze Zeit vor blinkenden Cursor gesessen sind und nicht wussten, was sie schreiben sollen, die können jetzt etwas produzieren. Aber es ist immer, was du reingibst, kommt auch raus. Also wenn man ja als Marketer sich mit einem Kunden beschäftigt dann will man zum Beispiel wissen, die Zielgruppe, was interessiert die wirklich, bevor sie kauft, wenn wir kaufen jetzt als Ziel definieren. Und dann ist einer von Ansätzen, den wir zum Beispiel lieben, ist, wir fragen einfach zum Beispiel den stärksten Verkäufer von dem Unternehmen und fragen, was sind denn die drei Fragen, die immer gestellt werden, bevor jemand das Ding da kauft? Oder was ist die Frage zu diesem Produkt XY? du schon nicht mehr hören kannst, weil das ist die, die die Leute auf jeden Fall brauchen. Und wenn man diese Informationen nicht in die KI reingibt, also echte Primärdaten, dann sucht sich es halt irgendwas aus irgendeinem Blabla aus dem Internet zusammen vielleicht oder Daten, mit denen es trainiert worden ist und schreibt einfach das so runter und dann wirkt es vielleicht schön und gut und eloquent, aber verkaufen wir jetzt nicht, weil vielleicht diese drei zentralen Fragen, die fast jeder Käufer hat, gar nicht beantwortet werden.

möchte nur dazu sagen, dass das, was du sagst, notwendig die KI zu trainieren. Das richtig. was die KI, und jetzt müssen wir bisschen unterscheiden, nicht nur dieser Chatbot, mit dem man Texte generieren, sondern auch die KI-Suche sehr gerne hat, nämlich die Antwort auf genau diese Fragen, die du jetzt beschrieben hast. Warum? natürlich auch im Netz öfter gestellt werden und wenn die KI darauf Antworten findet, ist natürlich in jedem Fall positiv.

⁓ Genau.

Jetzt gehen wir schon vom Text weg, Nehmen wir Bilder als nächstes. Und da wissen wahrscheinlich die meisten, die das probiert vor ein, zwei Jahren, also 24, auch noch 25, wenn man da Menschen abbilden hat lassen, sagen wir eine Gruppe von Personen, die am Tisch sitzen und sich bespricht oder am Spielplatz mit Kindern, Und man hat die Details angeschaut, dann es da erkennbar gewesen, dass diese noch Probleme gemacht hat. Jetzt gibt es da verschiedenste Programme, aber ich glaube es ist immer noch so, bei dem Allermeisten, dass sie mit Fingern und Co. Probleme hat. Was ist denn jetzt da deine

Ja, also das Problem im Bild mit Händen oder generell Körperteilen, also Finger, alles was ein bisschen feiner ist. ich sage es jetzt mal so, da gehen wir wieder weg von diesem, also wenn man das gut machen will, geht man wieder weg von diesem ich prompte und in zehn Sekunden habe ich das perfekte Ergebnis oder in 20 Sekunden oder in einer Minute, je nachdem welche K IMA jetzt benutzt. Und man muss halt einfach oft Prompt Engineering betreiben, man muss es oft probieren, man muss was Neues probieren, muss was ändern. Also Prompt Engineering, vielleicht sollte ich das kurz erklären, man hat einen Prompt, einen Befehl, den man reinschreibt in dieses Chat Fenster, damit dann kommt ein Bild raus und dann muss ich nur einzelne Teile verändern von diesem Prompt nennt man eben, ganze Konstrukt, diese ganze Angabe und man muss wirklich oft spielen und vielleicht sogar dann Beispielbilder suchen, was man gerne hätte. Die kann man im Internet suchen und sagen, mach mir was ganz anderes, so. Also kopieren wäre bitte nicht gut für alle, jetzt zuhören. Sondern einfach Beispiele oder Detailbeispiele rausnehmen und dann einfach immer wieder probieren. Natürlich gibt es diesen Wunderprompt manchmal, also den gibt es hin und wieder, dann kommt es perfekt raus beim ersten Mal. der Regel, wenn man wirklich damit arbeiten will, passiert das leider nicht.

Also was du beschreibst ist, dass man schon genau wissen sollte, die KI zu führen. Das haben wir zuerst beim Text schon gesagt, Ich sage das immer, wir sehen jetzt alle Führungskräfte, zumindest in Bezug auf die KI. Und das beschreibst du jetzt auch durch diese Angaben, den genau da anzuleiten, er, sie, das Gerät, die Maschine, das herausgibt, was wir gerne Die Geschichte dabei ist, dass man in verschiedenen und davon gibt es ja Hunderte, auch nur für Bildgenerierung, wissen sollte, welches wie tickt. Also meine geringe Bilderfahrung, sagt mir, Journey muss ich ganz anders führen, also ganz andere Angaben machen, als zum Beispiel diese Bildgenerierung von Chat GPT namens Dalle oder Tali, man das anspricht, die macht wiederum was anderes. Die von Gemini, ist jetzt mein Favorit im Moment. Der macht wiederum andere Dinge gut und mit dem muss ich wiederum anders arbeiten Und dann kommt nur dazu, dass die Dinge oft auch Geld kosten. So und jetzt sagen manche wieso Geld kosten? Man sieht doch diese ganzen tollen Bilder. Letztes Jahr ging da mal rum Donald Trump, der angeblich verhaftet wurde dann hat man gesehen, rund die Papastwahl einen Pabst. in einer weißen Daunenjacke. Oder es gab einen Papst, der dunkelhäutig war. Oder wir sehen Bilder aus Konfliktregionen, wie, finde ich, äußerst geschmacklos von Gazastreifen, das dann exklusive Urlaubsdestination dargestellt Und das verleitet Leute dazu zu glauben, das muss doch ganz leicht gehen. Kannst du da ein bisschen den Vorhang lüften.

Ja, absolut. Ich möchte einmal vielleicht auf diese zwei berühmten Bilder, die du genannt hast, eingehen. Ich habe mir das nämlich nach unserer Vorbesprechung Beginnen wir mal beim Babst mit der Taunenjacke. Das war tatsächlich ein 31-jähriger Bauarbeiter aus dem Großraum Chicago, der auf die Idee kam, diesen Pabst so darzustellen, nachdem er die vergangene Woche, so schreibt es zumindest an der amerikanischen Zeitschrift, psychoktiver Pilze gegessen hat. So ist er auf diese Idee gekommen. Der wird wahrscheinlich sehr KI verliebt gewesen sein. Und wahrscheinlich war das auch nicht sein erster Versuch. Und wenn es sein erster Versuch war, dann war es natürlich so, dass es einer dieser Lucky Shots war, sag ich mal. Schon das zweite Bild mit dem Donald Trump, verhaftet worden ist, das war der Elliot Higgins, das ist ein Journalist und Gründer eines Recherchenetzwerks in den USA. Der hat sich sicher Mühe gegeben, weil er ja genau ein Ziel vor Augen hatte, was er darstellen will. Und damit das Ganze so echt wirkt, wie er wollte, dass es wirkt, er das mit ganz, ganz großer Wahrscheinlichkeit, zig Male probiert, diese Bilder dann, er ja eine ganze Serie da veröffentlicht, bis diese Bilder so ausgesehen haben, damit das so täuschend echt ist. Und dann natürlich, wahrscheinlich hat er nicht nur eine KI ausprobiert, sondern mehrere KI ausprobiert, weil... eben wie du richtig gesagt hast, auch in der Bildgeneration ist es so, dass unterschiedliche KI's unterschiedliche Dinge besser oder schlechter kennen. Ich habe einmal für uns zusammengeschrieben, was wir bedenken, wenn wir ein Bild generieren, das ist jetzt allgemeingültig für alle KI's, was man eigentlich immer bedenken sollte. Also wir sagen immer Motiv, das heißt was ist ein Bild, also Person, Hund, Haus, Produkt, was auch immer. Dann Szene, wo spielt das Bild, also ist Stadt, Fantasie sind ja da keine Grenzen gesetzt. Dann Perspektive, wie wird das Motiv fotografiert in dem Fall? Ist das ein Close-Up? Ist das ein Portrait? Ist das ein Weitwinkel? Was ist das für ein Bild? Dann Licht und Licht wird oft unterschätzt und leider vergessen ist aber extrem wichtig für die Bildwirkung. Also ist es Golden Hour? Ist es ein sanftes Studiolicht? Ist es dramatisches Licht? vielleicht lichtabhängig auch das Wetter, wenn es draußen ist, man drauf ist es im Regen, ist es im Schneefall, es im strahlenden Sonnenschein, das strahlt ja direkt schon richtig Emotionen aus und dann ...

Stimmung.

Genau, genau. Und dann sage ich immer noch auch die Atmosphäre, also die Emotionen sollen direkt in den Prompt rein, also in diesen Befehl und da sagt man auch, also welche Emotion soll das Bild transportieren, soll es cineastisch sein, soll es futuristisch sein, soll es episch sein, soll es ... Ja, also gibt ja ganz, ganz viele Dinge oder ... Technische Details natürlich, willst du 4K, 8K, Hochformat, Querformat, das ist wichtig. immer wichtiger, in welche Zeit, in welche Epoche willst du... Also wir könnten jetzt ein Bild von uns aufnehmen und uns in die 80er Jahre zurückversetzen lassen von der KI sozusagen, wird man wahrscheinlich andere Hosen anhaben, andere Pulover ganz gleich. Also in welcher Zeit und in welcher Epoche spielt das Ganze. Und Farben sind auch noch ganz gut. willst du Pastelltöne, willst du das wärmer willst du das kälter haben? Das sind so die Basics, wo ich sage, okay, da sollte man schon umgehen, damit man das Bild bekommt, das man haben will. Und ich glaube, dass der Herr Higgins dieser Trump-Verhaftung sich sehr genau überlegt hat, was er haben will, welche Stimmung will er haben. Er hat sich genau überlegt, wie schaut das in den News in Amerika aus, wenn ein Mensch verhaftet wird? Wie wird das dargestellt?

Danke für diese ganzen Tipps, weil das sind alles wichtige Informationen auf jeden Vielleicht hat er auch, wie du es davor schon gesagt hast, es soll jetzt noch ein ein Sum-up für die Zuhörer sein, auch ein Bild einer Verhaftung von Personen der KI gegeben. hat gesagt, mach das so ähnlich und setz statt dem Verhafteten jetzt den Herrn Trump ein, tauscht er noch den Hintergrund aus und so weiter. Wie komme ich auf die Idee? Letzte Woche habe auch ich im WIFI eben KI-Verstehen und Anwenden Kurs da. gehalten und da hatten Leute aus dem Krankenhaus dabei hatten eben als Beispiel für die Bildgenerierung mit ja jemand jemand der im Bett liegt, Krankenhaus wird besucht und die sitzen am Bett und was hat die KI gemacht, hat die Person wirklich aufs Bett, an den Bettrand gesetzt, dann haben gesagt, nein, nein, das so nicht, das ist schon so eine Sitzgelegenheit am Ende des Bettes, und war das so eine Wohnzimmeratmosphäre, der Patient, Bett hat gelacht, es wäre vom Fernsehen, was ja schön ist, wir wir dann gesagt, okay der Patient schaut ein bisschen ernst da rein und es soll ein weißes Krankenhausumfeld werden und das funktioniert dann schon irgendwann, aber auch dieses Beispiel illustrieren muss einiges sich überlegen.

Absolut, oder du generierst Bild Bild Bild und dann nimmst du eines und von dem gehst weiter und merkst, die KI biegt in die falsche Richtung ab. Dann gehst du wieder zu dem zurück und gehst von dem aus wieder in die richtige Richtung. Das sind ja auch Arbeitsschritte, die man lernen muss und die man für sich auch, sei ich jetzt einmal, professionalisieren muss. Egal ob man es jetzt als Online-Marketing-Berater wie wir hauptberuflich macht oder ob ich jetzt zum Beispiel Unternehmer bin, der das selber umsetzen will und selber lernen will. Aber die Abkürzung gibt es leider nicht, wie es oft suggeriert wird. Man macht die Arbeit vom Strand aus und erledigt sich von selber.

Man kann sich als Hobby nehmen, ich werde jetzt gut in Bilder generieren. Und dann soll das auch jemand machen, ist total fein. Vielleicht aber davor doch mit jemanden, der Ahnung hat, wie so ein Bild ausschauen soll, einmal rücksprechen, nur weil es mir gefällt, ist es nur noch das richtige Bild, das meine Kunden anspricht. Also da weiß halt vielleicht jemand, der sich mit solchen Dingen beschäftigt, oft ein bisschen besser bescheidet. Im Texten habe ich den Eindruck, da das Hobby dann meistens schade, weil das die falsche Richtung läuft zu 90 % und dann keine Effekt kommt, keine Anfrage.

Vielleicht, wenn wir dann noch mit dem Hobby reden, auch noch eine Gefährlichkeit von der KI, ist nämlich die Rechtssituation von dem Ganzen. Also, was ja gerade sehr beliebt ist, ich erzeuge Portraits von mir und Mid Journey kann das zum Beispiel sehr, gut, mich in andere Szenen setzen und so weiter. Wenn man sich dann aber das Kleingedruckte von Mid Journey durchliest, ja, Mid Journey hat einen sogenannten Stealth Mode, das heißt, dass diese Fotos nicht allgemein reinkommen, für den muss man, soweit ich weiß, extra bezahlen. sollte man dieses Pro-Abo kündigen, diese Fotos trotzdem in die Öffentlichkeit. Und wenn das eine andere Person ist als ich diese Person das gar nicht entschieden und die Person hat aber immer das Recht am eigenen Bild. Und da kann es vielleicht zu Problemen kommen, wenn dieses Foto plötzlich jedem, so wie es ja bei Mid Journey ist, zur Weiterverarbeitung zur Verfügung steht.

Klar, die rechtliche Problematik in jedem Wenn man da sensible Informationen reinlädt und Auf jeden Fall da auf der Hut sein und sich genau erkundigen. Und was du dir eben sagst, dass es später noch kommen kann, ich rate also den Kursteilnehmern immer eine Liste zu führen über alles, was sie generiert haben und auch verwendet. Und da soll dann drinnen stehen, auf welcher Seite wirklich mit Link verwendet haben, wann sie es generiert haben und sich noch abzuspeichern, was damals die AGBs gesagt haben, damit sie das noch haben. Warum sage ich das? Weil sogar Dienste wie Canva das durften sehr viele im Unternehmenseinsatz haben, aber da darf man die Bilder, nur mal bis zu einer gewissen Größe, also weiß es nicht mehr, auch so Wir verwenden immer Pixelgröße. Ansonsten muss man das bezahlen, weil die Problematik ist mit der CC0-Lizenz. Offensichtlich haben sie sich nicht genügend abgesichert. Das Urheberrecht ist in Europa strenger geahndet als in den USA.

Mhm.

Jetzt haben wir gesagt, Texte gehen recht schnell. Bilder, da sollte man schon auch einiges wissen und beachten. ihr habt jetzt vor kurzem ein Werbevideo produziert für euch selbst, also für die Agentur Klickbeben Und du hast mir erzählt, dass dich viele Leute darauf angesprochen haben. Magst mal kurz sagen, wir werden es auch verlinken, in den Shownotes uns natürlich das was geht es da, bitte sagst uns wie lange das Video dauert und wie lange die Arbeit dran gedauert hat. sind schon ganz gespannt.

Also das Video zeigt mich jetzt in verschiedenen die sehr bekannt sind aus verschiedenen fliegt zuerst eine Drohne von der Sprungschanze in Innsbruck, also von der Bergiselschanze, Richtung Goldenes Dachl. Dann hänge ich als Spider-Man verkleidet, also ähnlich wie Spider-Man verkleidet, am Goldenen Dachl. Danach glaube springe ich runter und bin Superman und erkläre einfach was über Website-Erstellung. danach bin ich kurz so eine Art Iron Man und dann eine Art Batman, wenn man so So ähnlich oder Mensch teilweise Roboter-Dingen und so. wir wollen halt damit zeigen, dass wir eine zukunftsorientierte Agentur sind, die halt Webseiten auch zukunftsfähig plant und... auch hier eine Förderung abwickelt und am Ende gibt es ein Call to Action, dass die Kontakt aufnehmen und quasi ein Blitz, der glaube ich reinfährt und unser Logo schreibt oder so.

Also darf ich das ganz kurz abstrieren? Nochmal danke für die Beschreibung des Videos. Also es ist ein sehr aufmerksamkeitsstarkes Video, wo ihr das Ziel habt, gemerkt werden oder dazu bringen, dass er sagt, wow, das ist jetzt was besonderes, da könnte ich jetzt mal anfangen. Okay, aufmerksamkeitsstark.

Aufmerksamkeitsstark für Tiroler in dem Bundesland, in dem wir jetzt gerade sitzen, weil Goldene Dachl das Wahrzeichen auch noch. Also auch noch bisschen Lokalkolorit drinnen.

kurz nochmal nachgefragt. Du warst ja mehrere Personen, oder Darsteller. Du warst Spider-Man, Batman und noch ein paar andere. Wie viel Arbeit ist das? So einen Drohnenflug, habt ihr denn gemacht? Habt denn simuliert? Oder dich jetzt als Protagonist in die Rolle dieser Superhelden schlüpfen zu lassen?

Genau, Also ich bin immer nur ähnlich, wie Spider-Man oder so. Also es erinnert ein bisschen dran, aber das Kostüm ist natürlich anders. Aber es ist klar, wenn einer einer Wand rumklettert, dann ist er eine Art Spider-Man, nenne ich es jetzt mal. Und das ist so, ich hatte kein einziges Kostüm an. Wir haben nicht einmal diesen Drohnenflug gemacht zum Goldenen Dachl, sondern das ist alles KI generiert. Und deswegen ist es auch so gut, dass wir beginnen Text, Bild, Video jetzt in dem Video, weil genau so ist der Schritt, wie wie das ganze Video entstanden ist. Du beginnst mit einem Text, machst aus diesen Texten Bilder und aus diesen Bildern dann dieses KI-generierte Video. Also immer mit KI-Hilfe. Und das ist so ein stetiger Prozess sozusagen.

Da kann welche Szenen hätten wir gern. Mach mir einen Drohnenflug von der Bergiselschanze zum Goldenen Dachl. Was muss man allein für diesen Drohnenflug, der dann im Video wie lange dauert?

Ich glaube im Video 4 Sekunden.

Wie lange hat sie da gebraucht? das finde ich jetzt total legitim, wenn du sagst, sie hat es jetzt lang gebraucht, weil es ist halt nicht so einfach. Wie viel Aufwand steckt da schon drin?

Also nur in der ersten Szene, sag ich mal, ist ein bisschen unfair, weil wenn man das natürlich von hinten aufrollt, kann man sagen, geht ja viel schneller, aber ich sag es jetzt mal so, ich hab mir das so aufgeschrieben, den gesamten Workflow, beginnt mit der Ideenfindung. Das heißt, du brauchst mal die Idee für das Video und irgendwann war halt die Idee weil der Hintergrund ist der, wir also Ich und meine Mitarbeiter, nennen uns das Superteam für unsere Kunden sozusagen. Wir wollen die Helden für unsere Kunden sein, wir wollen schauen, dass das für die funktioniert. Daraus ist die Idee entstanden, dass wir das mit Superhelden machen und danach ging es in die Skripterstellung. Skripterstellung ist einmal, ist noch gar nichts mit Bildern und so, sondern da ist einfach nur mal, ich schreibe einen Text, was will ich sagen, was soll Und dann, wenn ich das habe Und da muss ich sagen, je nachdem, was wir für einen Skript machen, steckt ja auch Recherchearbeit drinnen. Also in dem Fall wird eine Förderung erwähnt. Da muss man schauen, ist diese Förderung jetzt verfügbar, Da kann es auch deutlich Themen, die mehr Recherche verlangen, brauchen. Das heißt, hier würde ich auch sagen, da steckt die meiste Arbeit drinnen. Jetzt so einmal im Step 1.

Das ist jetzt die Überlegungen, die wir, also du oder ich, je nachdem, welches uns jetzt vom Kunden angesprochen wird, machen, für den Kunden ein richtiges, man kann es jetzt Skript oder Konzept so machen, das richtig Sinn ergibt, oder?

Genau, genau. Weil das geht ja auch noch weiter, oder? Also erstens einmal, wenn du dich für einen Kunden ransetzt, da wird es dir ähnlich gehen wie mir, du hast ja nicht eine Idee und da hoffst du, dass die jetzt gefällt oder die jetzt dann ankommt, sondern du hast ja fünf, sechs Ideen, zehn Ideen, manchmal sprudeln sie, manchmal dauert es ein bisschen länger, manchmal kommen sie beim Duschen, weiß ich beginnst so leicht reinzuarbeiten und dann merkst du ja, okay, da geht es besser, da geht es schlechter. Und dann arbeitest du das immer mehr aus und aus und aus und dann irgendwann hast du bei einem oder zwei, drei von dem das ganze Skrip. Und dann hast du ja wirklich Bilder im Kopf, aber sie sind halt noch nur in deinem Kopf, wird gesagt. Und das Problem mit den Bildern im Kopf ist, anders als vielleicht bei diesem berühmten Lied, weil da ist ja immer Vergangenheitsbilder im Kopf, die sind vielleicht schon relativ detailliert, aber... Die Bilder, man im Kopf hat, die sind ja nicht so detailliert. Man hat so ungefähre Vorstellungen und so. Und aus diesen Bildern nimmst dann Szene für Szene und erstellst quasi echte Bilder

Magst uns die eine Szene nur eine von...

Nehmen wir die mit dem Drohnenflug. Wir brauchten ein Foto mit Ausblick von der Bergiselschanze. Das hatte ich auf meinem Handy. Das ist mein Vorteil. Ich hatte dieses Bild auf meinem Handy. Das heißt, ist das Startbild sozusagen. Genau, dann brauchte ich ein Bild vom goldenen Dachl, weil dort landet dieser Drohnenflug und der soll extrem schnell gehen Und also ich brauch das Anfangs- und das Endbild für diese Szene. Das heißt, also man kann jetzt entweder zum goldenen Dachl fahren und ein Bild machen oder muss ein Bild kaufen und die Rechte dafür erwerben. In dem Fall haben wir gekauft und die Rechte dafür erworben. Und dann braucht man noch ein Bild von mir. Gut, ist jetzt nicht so schwer. In dem Fall haben wir eine Laura trainiert, so nennt sich das Flux Laura, diese KI mit so circa 20 bis 25 Bildern von mir aus allen Winkelseiten mit blöden Blick, mit gescheiten Blick, mit lachenden Blick und haben dann diese drei Bilder genommen und gesagt, ok, am Anfang der Drohnenflug dorthin und dann brauchte ich als erstes ein Bild von weit weg, wo jemand auf dem goldenen Dachl hängt sozusagen, also dieser Charakter, den ich mit der Flux Laura erzeugt habe. Und dann geht es ja ganz nah ran und man sieht quasi mich im Porträt, das heißt ich brauchte danach ein Bild so, wie würde das denn aussehen, wenn ich wirklich so auf dem goldenen Dach hängen würde sozusagen. Also wer ist der Typ wirklich?

Da wollte ich gerade einhaken. Das mit dem Bild von der Schanze und dem goldenen Dachl können wir uns alle vorstellen dass wir es machen oder kaufen. Ich habe Flux Laura letzten Sommer versucht. jetzt für alle Zuhörer, ist, Es gibt Entwicklerplattformen, wo man solche Modelle herunterladen kann. Und das ist schon etwas für Bastler. Also das macht ja nicht jeder. Das ist ja nicht etwas was ich in Nano-Banana eingebe. und dann kann man das, du richtig gesagt hast, mit eigenen Bildern trainieren. Ich habe da gleich mal, glaube ich, 30, 40 Dollar verschossen gehabt, weil ich vielleicht das noch nicht so gut gemacht habe und war mit dem Ergebnis überhaupt nicht zufrieden. Null. Also, ist da gleich mal bei Zeit und Geld, wie man einfach nur so Modelle probiert hat. Du bist bei Flux Laura geblieben. es ist ein tolles Modell. Man muss da verdammt viel lernen.

Absolut. Also, auch wie gesagt, also allein, ich hatte davor schon meine Probierphase mit Flux Laura und so. Aber obwohl ich sage, ich habe das schon öfters gemacht und habe schon mehrere Lauras trainiert gehabt, das war für diesen, nur für diese Szene glaube ich das 25. Bild oder so.

Genau, danke für diese realistische Einschätzung. Dann ist diese Szene von vier Sekunden, hat dann in echt gedauert, wenn wir jetzt das weglassen, aber sagen, Bild generieren, 25 Bilder, wir wissen schon welches Modell, wie lange sitzt man da noch?

Wenn wir schon wissen, welches Modell und dann, also du brauchst ja dann noch ein Modell, das quasi diese Fotos zu einem Video zusammen.

Genau, aber jetzt haben wir einmal die 25 Bilder generiert und sagen so, jetzt haben wir das.

Ja, ich sag nur diesen Teil vom Skript rechnen, man es raus sagt, da kannst du schon mal eine Stunde dran gesessen sein, eher zwei oder drei sogar. Weil Ideenfindung, ich mein das Skript dann halt durch, zehn Szenen dividieren oder so ist schwierig. Aber sag mal, also allein für die 25 Bilder kannst du eine Stunde sitzen, wenn nicht eineinhalb Stunden.

Ideenfindungskript so lange wie nötig, Abstimmung mit dem Kunden oder mit einem selber, das dauert länger als eine Stunde.

Ja, absolut. Wenn man alles weiß und man selbst der Kunde ist und man macht es für sich selber, dann kann man richtig Aber ich glaube ehrlicherweise, wenn ich jetzt so, also ich sag so, es kann schon sein, dass das eine oder andere Bild zwei Minuten Ladezeit hat, dann bist du mit 25 Bildern eh schon nur Ladezeit bei einer Stunde. wahrscheinlich, ich hab nur das Gesamte gemessen fürs gesamte Video, das kann ich sagen, das waren 21 Stunden. Also das war, also die Gesamtzeit vom Video haben wir, wir tracken immer die Zeit bei unseren Aufträgen, waren 21 Stunden.

Das war eine Stunde vielleicht. Das waren 21 Stunden für jemanden, der das schon zigmal gemacht hat und schon weiß, der vom Fach ist. Das ist nicht nichts.

Genau, also ich merke das ja, wenn wir Mitarbeiter trainieren und einschulen und so, da kann ich sagen, dass manchmal Tätigkeiten, die, wenn du drei Jahre da bist, fünf, sechs Stunden dauern, dass die mal eine Woche dauern, also wirklich 40 Arbeitsstunden oder vielleicht sogar auch manchmal zwei Wochen im Extremfällen. Was nicht heißt, dass diese Leute dann untalentiert sind, sondern dass es einfach diese... Erfahrung braucht und die Lernkurve ist einfach da. Und gerade in der KI darf man nicht vergessen, es gibt also diese Theorie des Mount Stupid. Also man taucht in ein Thema ein, denkt jetzt hat man es verstanden und merkt erst dann danach, wie wenig man von dieser Materie weiß sozusagen und versteht.

Man meint oft, zu wissen und dann erkennt man erst, Und das ist natürlich bei allem was Neues.

Und im Tun kommt man auf die Dinge drauf, die man alle nicht weiß. Weil es klingt alles immer so einfach und so super von außen, aber es ist ganz anders.

Danke für den Einblick. Jetzt weiß ich nicht, gibt es noch ein paar Dinge, du uns Video sagen was du uns da mit teilen möchtest, es dann weitergeht, wir diese Bilder haben?

Absolut, Also Storyboard schaut bei uns so aus, wir haben ja diese Szenen, diese geskripteten und wir machen dann zu jeder Szene ein bis zwei Bilder. Ziel ist so, dass eine Szene, das ist nämlich auch was, die KI erstellt nicht ein 30 Sekunden Video mit einem Prompt, sondern im Durchschnitt sind diese Videos, die da erstellt werden, fünf Sekunden lang. Man kann sie manchmal auf zehn ausdehnen und das heißt, man muss aber auch dann schon wissen, okay 45 Minuten Videos sind mindestens neun Schnitte.

45 Sekunden.

Sekunden sind mindestens neun Schnitte, weil neun mal fünf... und meistens braucht man ja nicht alles von den fünf Sekunden, sag ich mal, sondern du schneidest ja öfters sozusagen. Das dann kann man das ruhig mal neun rechnen. Es gehen dann manche Szenen gehen schneller, manche gehen wirklich... Bei einer hat man vielleicht Glück gehabt und die ist wirklich in vier Minuten drinnen. Aber insgesamt, wie gesagt, mit 23 Stunden ist man schon da und ich würde sagen, wenn man das erste, das allererste macht, sage ich, kann man schon 100... und da dauert Stundenrechnung bis man so zufrieden ist.

Es ist fünffach, wenn wir das rechnen.

Vor allem darf man nicht vergessen, Video-Editing war ja bei uns schon know-How vorhanden. Das heißt, wie macht man Soundeffekte rein? Wenn man sich das auch noch alles erst erarbeiten muss, ist das Ganze natürlich schon nochmal schwieriger.

Ja, jetzt ist es ja so, wir nehmen jetzt ja Audio auf. Ich weiß ja schon, wie viel Arbeit es macht, Videocast aufzunehmen. Und da brauche ich gar keine KI dafür. Aber so etwas zu Gänze zu erstellen. Also ich bleibe noch beim echten Video. Warum? Und das sollte man ja auch wissen, dein Einsatzzweck für dieses Werbevideo, ist ja goldrichtig, warum ihr das gemacht habt Wenn ihr jetzt aber mit Leuten arbeitet, für sich selber, weil sie Berater sind oder die wollen ja authentisch rüber kommen, da ist es vielleicht auch nicht die beste Idee, weil man könnte ja, das haben wir noch nicht gesprochen, einen wirklichen Avatar machen, von den Bildern, die du jetzt gesagt hast, könnte einen Avatar draus machen, der die weiteren Videos spricht. Das wäre für dich und für mich ein Leichtes, das für einen Kunden zu machen. Ob ich ihn dahin berate oder ihn davon abrate, das hängt ihm wirklich davon ab, was er tut.

Ja genau, und das hängt auch von seiner Computeraffinität ab. Ich nehme an, da geht es dir ähnlich. haben ja schon Kunden, denen wird schlecht, wenn sie fünf verschiedene Programme am Handy aufmachen müssen. Die ärgern sich über digitale Signaturen und so weiter, dass man das jetzt alles machen muss die meiden den Rechner, wo es geht .

Für die ist es dann nichts, aber die wollen ja genau den Avatar haben. Aber das würde ich ihnen halt nur dann anraten, wenn das zu ihrem Geschäftsfeld passt. Wenn es viel besser wäre, dass es ihr persönlich rüberkommt, dann vielleicht lieber nur Stimme, aber dafür in echt.

Genau. Genau, was ich jetzt gemeint habe war, da ist es natürlich super, sie können es an Leute wie uns auslagern und sagen, wir haben was. Aber ich habe jetzt an die gedacht, die es selber machen wollen jetzt ich verstehe. Ja, okay. Wo ich sage, jetzt stell dir vor, die wollen schon das, ich sage jetzt mal, mit dem Handy sich aufnehmen, nicht? Und wo ich sage, da brauche ich jetzt nicht viel, Stativ und vielleicht ein Mikro, ein Mikro muss gar nicht einmal sein, aber ... und vielleicht ein paar Fotos und das zu posten nach dem Konzept, das man ihnen schreibt oder ihr Hand gibt, ist schon oft zu techniklastig. Und die dann noch zu sagen, okay schau her, und wenn du das dann mit Effekten aufhetten willst, dann machst du noch bisschen KI-Effekte rein. Das wird nicht funktionieren, weil irgendwann, wenn das nicht beim ersten Prompt funktioniert, ist die Verzweiflung groß und die Enttäuschung groß.

Schön, dass du uns da so mitgenommen wirklichen Aufwand der Videoerstellung, weil die Enttäuschung, die oftmals sehe, wirklich daher kommt, dass der Eindruck vermittelt wird, egal ob es jetzt Text, Bild oder eben sogar Video ist, dass es so einfach ginge. Ja, der Lucky-Shot, hast du ja erwähnt, kann passieren, ist halt sehr sehr selten und das Ziel und das geführt werden ist umso komplizierter. Die Aufgabe wird komplexer. Wir haben von dir schon gehört, es wird Text gemacht, wird daraus Bild gemacht. Man braucht einen Skript, braucht eine ganz beginnende Idee und das muss Schritt für Schritt erstellt werden. Was wir noch gar nicht gesprochen haben, vielleicht machen wir heute einen Anormal, ist die ganze Voice-Geschichte. Da gibt es ja auch so viel. Die Leute haben gemeint, müssen ganz viele Chatbots machen. Es gibt in jedem dieser Felder extrem viel zu lernen. hoffe, dass können wir uns einigen.

Absolut, absolut. Also nach dem ... Schritt 4 nach dem Storyboard ist bei mir dann die Video Creation. da ist natürlich, also wir machen jetzt diese Videos, wie auch immer diese Clips entstehen, da gibt es Mensch KI, Hybrid, Image to Video, Talking Head, was du jetzt eben vorher gemeint hast. Aber Aufnahme der Tondateien gehört auch genauso rein, weil ich musste die ja nachher lipsynken im Video in dem Fall. Und dann kommt noch vielleicht einmal, da eine oder andere Soundeffekt passen, dazu generiert werden oder gefunden werden. Und dann der Schritt 5 ist dann das Video Editing, schneiden, zusammenfügen und so weiter, wo ich sage, das ist auch noch mal einer der großen Brocken an Zeit. Und das sind dann die Dinge, wenn einem das vorher schon zu hart war, ist es jetzt ja nicht so viel weniger Arbeit, sondern die Arbeit bleibt noch die gleiche. Auch hier gibt es natürlich KI, die hilft, es geht ein bisschen schneller, aber es ist trotzdem noch stundenlang vom Rechner sitzen.

Ja, so ist das. So ist die schöne neue Welt, macht Vieles möglich, aber man muss halt trotzdem nur Bescheid wissen, wie das Ganze klappt. Manuel, vielen, vielen Dank. Ich glaube, es bleibt spannend. Vielleicht wollen wir ja noch mal irgendwann über das Thema oder eines aus dem breiten Feld von KI und Marketing sprechen. Inzwischen sagen wir vielen, Dank für deine Zeit und die Einblicke. Gibt es noch etwas, was du den Zuhörern gerne mitgeben möchtest. Was dir persönlich wichtig ist Möchtest du was mitgeben?

Nein, vielleicht einfach nur die realistische Einschätzung, weil wir es jetzt ein bisschen schwarz gemalt haben sozusagen. Vielleicht einfach nur aus unserer Vergangenheit. Wir haben zum Beispiel selber auch so Recruiting-Videos oder Image-Filme auch oder Werbevideos für uns erstellen lassen, wo ich sage, darf man jetzt auch nicht alles schwarz malen. Früher war Filmagentur da, zwei Tage bei uns im Büro. Das Büro war Stillstand, hat 10.000 Euro Und es gibt jetzt natürlich Möglichkeiten, die es früher nicht gegeben hätte, weil ich Ich glaube nicht, dass die Stadt Innsbruck gesagt hätte, ja, kein Problem, kletterst du für dein Video aufs Goldene Dachl und machst das oder fliegst mit einer Drohne von der Schanze einfach quer, da fliegen ja Flugzeuge bei uns in Innsbruck die ganze Zeit, wir stoppen mal den Flugverkehr, fliegst mit einer Drohne fürs Video einfach mal von der Schanze zum Goldene Dachl. Das wäre einfach nicht möglich gewesen. Und natürlich, die Produktionskosten sind gesunken, aber Es ist halt, was oft nicht gesehen wird, ist die Lernzeit, da drinnen steht, die Ausbildungszeit, die genauso wie bei jedem anderen Beruf natürlich dahinter Es ist eine schöne neue Welt, das kann man schon sagen, es gibt neue Möglichkeiten. Im Gegensatz zur alten Welt ist vieles einfacher, aber es ist nicht so einfach, wie es oft suggeriert wird, ich mache das mit Laptop am Strand im Urlaub, weil in fünf Minuten bin ich mit dem Video fertig, das nächsten Monat Millionen Aufrufe generiert. Das ist es nicht.

Da steckt noch ein bisschen was drin. Vielleicht reden wir über das das nächste Mal, was es nämlich braucht, Content nämlich auch zu distribuieren. Also da lassen wirklich viele sehen. Manuel, vielen, Dank. War spannend. Ich hoffe, wir sprechen uns bald wieder. Danke."