konsistente Person über verschiedene Szenarien behalten?

  • Ist es möglich, ein und dieselbe Person in unterschiedlichen Szenarien -wie, im Raum, in den Bergen, auf einem Boot etc - davon Bilder zu erzeugen? Wenn ja, wie? Optimal wäre, wenn die Person auch unterschiedliche Ausrichtungen hätte (von der Seite, von vorn, von oben etc.)

  • Ich weiss was du meinst.

    Das geht leider nur mit Personen, welche die KI kennt. Also zB Schauspieler. Damit geht es. Mit dir selber, denke ich mal nicht. Oder musste halt lokal versuchen und die KI auf dich trainieren.

    wenn etwas möglich erscheint mach ich das, wenn das nicht klappt gehts ans unmögliche und ansonsten das undenkbare.

    - nun stolz rauchfrei - Ich denke also Bing ich!

    Support 24h Bereitschaft 0173 6107465 - NUR Für Kunden von SEO NW!

  • Ich gehe davon aus, dass Du Personen meinst, die die KI erstellt hat und keine echte, die irgendwo im Netz ist, ala Deep-Fake.

    Da musst Du etwas mit rumspielen. Das dauert, aber geht durchaus (aber nicht perfekt). Wobei "ein und dieselbe" dann eventuell nicht 100% passt.

    Ansatz 1: Nutze eine gute und klare Vorlage der Person. Also am besten nur die Person selbst, ohne einen Hintergrund oder eben alles, was ablenkt. Wenn ein Bild da nicht ausreicht, dann nimm mehrere. 3, 4 8, keine Ahnung. Die können dann auch unterschiedliche Blickrichtungen haben, das ist eigentlich egal, solange die Person selbst als solche erkennbar ist, dass es die gleiche ist. Mit dem Prompt muss man dann wirklich experimentieren und vor allem auch eine Gewichtung auf die Bilder setzen (--iw x) und eventuell den Style auch auf "raw" setzen, damit die KI nicht zu viel selbst erfindet.

    Ansatz 2: Ein Bild mit der Person erstellen lassen, die man möchte. Dieses Bild dann variieren. Aber nicht mit "vary subtile/strong", sondern mit "vary region". Dann im Bild das auswählen, was geändert werden soll, also alles außer der Person eben und einen neuen Prompt eingeben. Die KI lässt denn dann den nicht ausgewählten Bereich eigentlich unangetastet und füllt dann mit dem neuen Prompt den markierten Bereich. Damit sollte zumindest der Hintergrund änderbar sein, aber der Blickwinkel dann nicht. So sind eigentlich die Bilder zu Halloween entstanden. Die Personen und Kostüme waren eigentlich gut, der Hintergrund aber falsch. Also eben das alles ändern lassen.

    Ansatz 3: Mit dem Seed arbeiten. Also erst mal ein Bild erstellen mit einer Person, die einem dann gefällt. Nichts anders mit dazu. Das passende Bild dann skalieren und downloaden. Den Seed dazu abfragen. Dann (wie in Ansatz 1) neuen Prompt. Bild von vorher, Seed von vorher und wichtig, Prompt von vorher. Man kann den dann erweitern, aber nicht initial ändern. Der Original-Prompt muss enthalten sein. Eignet sich für kleinere Änderungen, wie "gib der eine Tasse Kaffee in die Hand".

    Ansatz 4: Auch mit Vary-Region, aber umgedreht. Bild von der Person erstellen lassen und downloaden. Neues Bild mit anderer Position, Handlung erstellen. Dann per vary region das Gesicht oder die Person auswählen zum Ersatz. Im Ersatzpromt dann das Bild von vorher nehmen. Anders ausgedrückt: Das Gesicht des neuen Bildes mit dem von vorher ersetzen.

    Das geht alles nicht 100%, kommt aber eigentlich ganz gut hin.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Hm, ich glaube die Funktion die du suchst heißt entweder inpaint oder faceswap, wobei du ein Referenzbild mitgibst.


    Hatte aber auch Probleme damit, meistens hat es dann die Person eingefügt, aber das restliche Bild mit verändert. Also z.b. Hintergrund oder den Körperbau der Person ebenfalls neu erstellt.

  • Hatte dazu gestern just das hier in einem Newsletter bekommen.

    https://medium.com/@whytryai/how-…es-e272e64d22c3

    Ich weiß nicht mehr, aber Stable Diffusion hatte da auch was. Ich weiß nicht mehr, wie das hieß, habe nur noch die Erklär-Grafik im Kopf. Da wurden Bilder von Personen und Gesichtern quasi "erkannt" wie mit einer Bilderkennung und dann konnten die über diese erkannten Werte in andere Positionen gebracht werden (motion). Also aus einem stehenden Mann in einer Straße, wurde eine Person, die in die Luft sprang etc. Hab aber echt keinen Schimmer mehr, was das war. War ein Addon / Model für SD.

    Also so was wie das da, aber ein anderes halt: https://www.nextdiffusion.ai/tutorials/how-…table-diffusion


    ContrelNet war aber auch beteiligt.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Das ist quasi mein Ansatz 1 oben, nur dass der die Vorlagen speichert und in meinem Fall die nach bei jedem Prompt wieder angegeben werden müssen. Er gibt dann also den "Namen" an, bei mir müsste man die Bild-URLs wieder reinkopieren.

    Es gibt durchaus auch noch einen anderen Ansatz, weiß gerade nicht, wie das heißt. Da kann man seine ganzen Einstellungen quasi speichern, ohne immer wieder sagen zu müssen, was man wo wie haben will, auch Blickwinkel, Kamera-Typen, Linsen und Belichtungszeiten. Hatte das aber noch nie getestet, denn das Problem dabei ist, das wird dann vom ganzen Server verwendet. Gut, ist ja Sinn der Sache, wenn man den eben alleine nutzt, aber wenn man den teilt, dann ist das doof.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • P.S. Etwas OT. Beachtet bei allen Versuchen und was auch immer Ihr macht, dass Midjourney nun offiziell auf die Version 6 umgestellt hat. Also das alte Promptformat geht nicht mehr, auch nicht, dass man ein Bild von vor etlichen Wochen oder Monaten einfach noch mal variiert. Hatte ich gestern versucht und bin verzweifelt, bis ich dann merkte, andere Version. Wenn man also eine alte Version nutzen will, dann muss man --v 5.2 oder eben --v 5.1 angeben. "--v 6" ist nun der Standard.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(