Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Verfasst: 03 Jul 2022 19:52
Ob Text, Ton oder Grafik. Apps wo mit Hilf vo AI (künschtlicher Intelligänz), wasmer villicht nüchtern betrachtet au als statistisch errächneti Ergäbnis, basierend uf extrem grosse, durch Mensche erzügte Datemänge, übersetze chönnt, wärdet immer populärer. Ich möcht in däm Thread eigengtlich nit uf moralisch ethischi Betrachtige igo. Ich bin sälber Grafiker und ich find die Entwicklig mehr Fluech als Säge, aber leider isches nit ufhaltbar. Und um über d'Ängscht zrede, isch miner Meinig nach de Thread" okay, jetzt wirds langsam scary..." vom Master (G) besser geeignet.
Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?
Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.
Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.
Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0
Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:
Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.
Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.
s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk
Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/
Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han:
Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?
Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.
Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.
Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0
Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:
Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.
Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.
s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk
Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/
Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han: