Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Moderator: Avenger
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Ob Text, Ton oder Grafik. Apps wo mit Hilf vo AI (künschtlicher Intelligänz), wasmer villicht nüchtern betrachtet au als statistisch errächneti Ergäbnis, basierend uf extrem grosse, durch Mensche erzügte Datemänge, übersetze chönnt, wärdet immer populärer. Ich möcht in däm Thread eigengtlich nit uf moralisch ethischi Betrachtige igo. Ich bin sälber Grafiker und ich find die Entwicklig mehr Fluech als Säge, aber leider isches nit ufhaltbar. Und um über d'Ängscht zrede, isch miner Meinig nach de Thread" okay, jetzt wirds langsam scary..." vom Master (G) besser geeignet.
Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?
Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.
Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.
Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0
Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:
Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.
Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.
s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk
Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/
Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han:
Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?
Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.
Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.
Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0
Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:
Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.
Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.
s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk
Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/
Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han:
Jetzt machts Zing in der Schüssel!
- Moff
- PC Gaming Master Race
- Beiträge: 12897
- Registriert: 05 Mär 2002 18:03
- TRADINGPOINTS:
-
40
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
han letschte wuche beta access gha zu midjourney und ich finde das unglaublich beidruckend.
unvorstellbar was i dere hisicht i 10 oder 50 jahr möglich isch und wie das euse alltag veränderet
unvorstellbar was i dere hisicht i 10 oder 50 jahr möglich isch und wie das euse alltag veränderet
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
los, heb Bildli ine wo gmacht hesch!
Jetzt machts Zing in der Schüssel!
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Making the impossible impossible....
Han es Bild mit em Prompt "squaring the circle" rächne lo, also "quadratur des kreises", das bekannte Paradoxon womer mol in der Schuel glernt händ. Und ratet mal was debi usecho isch! Nüt!! ich bechum keini bruchbare Ergebnis! Jedes Bild woner erzügt, isch verschwumme! Sälbscht nach 300 Steps, wo die meischte andere Motiv bereits überlade sind mit Details...
und es goht witer: szweite Bild heisst "the meaning of life". Ebefalls nach rund 300 steps! Was isch zseh? es verschwummes nüt, mit öppis dunklem wo so usgseht wie Hebräischi Schriftzeiche...
Han es Bild mit em Prompt "squaring the circle" rächne lo, also "quadratur des kreises", das bekannte Paradoxon womer mol in der Schuel glernt händ. Und ratet mal was debi usecho isch! Nüt!! ich bechum keini bruchbare Ergebnis! Jedes Bild woner erzügt, isch verschwumme! Sälbscht nach 300 Steps, wo die meischte andere Motiv bereits überlade sind mit Details...
und es goht witer: szweite Bild heisst "the meaning of life". Ebefalls nach rund 300 steps! Was isch zseh? es verschwummes nüt, mit öppis dunklem wo so usgseht wie Hebräischi Schriftzeiche...

Zuletzt geändert von The Sheep am 08 Jul 2022 14:17, insgesamt 1-mal geändert.
Jetzt machts Zing in der Schüssel!
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Hät sich GOLEM (Also sprach Golem, Stanislaw Lem) nöd sälber abgschalte, nachdäm er sabsolute Wüsse und umfassendi Intelligänz erreicht hät? Dadruus schlüssend channs längerfrischtig kei wahri KI gäh, will so e KI dSinnlosigkeit vo allem erchänne und sich sälber uuschalte wür.
Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Jetzt bini iglade worde vo openai zum teschte vo DALL-E. Jau, das isch namol en anderi Qualitet. Macht richtig Laune das Tool.
Jetzt machts Zing in der Schüssel!
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
no es paar mehr. Die Bilder sind im Fall nit reproduzierbar. DALL-E interpretiert de Text jedesmal neu.
Jetzt machts Zing in der Schüssel!
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
- Mr Burzel
- VIP-Member
- Beiträge: 1653
- Registriert: 16 Mär 2006 08:28
- Wohnort: /dev/null
- TRADINGPOINTS:
-
381
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Meine Kunst mit Midjourney:




Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
bi o grad am midjourney teste... es isch unfassbar!
jedem wo's zeigsch gheit dr chinnlade abe...
jedem wo's zeigsch gheit dr chinnlade abe...
- zeromeier
- The(G)net - Redakteurrrrr
- Beiträge: 17693
- Registriert: 06 Dez 2007 09:55
- TRADINGPOINTS:
-
970
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Wüki no fönny: latin girl in bikini eats pizza on a car



Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
so han au mal chli umebastlet, han aber na mueh mit gnau beschriebe. aber isch scho krass wie wiit das doch scho fängs isch.
han mi mal für Dall-E waitinglist igschriebe.
han mi mal für Dall-E waitinglist igschriebe.
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
midjourney super. wie chunt me zu imagen? google glaubs na chli angst das öffentlich z teste.
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
jetzt chömet 3D Designer dra. In London gits e Startup namens KAEDIM. Die händ e zimlich mächtigi Software entwicklet, wo mit Hilf vo AI chann 3D Modäll us Bilder rächne, in wenige Sekunde. Leider gsehn sie ihr Tool nit als Gschänk and Menschheit, sondern eher als Möglichkeit e hufe Gäld zschöpfe. Ihr Zahligsmodäll fangt bi 599 Dollar pro Monat a für maximal 30 Generierige und goht bis 15'000 Dollar für 1000 Generierige.
Jetzt machts Zing in der Schüssel!
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
han jetzt mal mit chatgtp en landingpage baut (code haets grad usgspuckt, schon na geil, coders werdets also au schwieriger ha in zukunft) und dezue na en seo optimierte text, de ich den widrum han pruefe lah ob google bemerkt ob das vo chatgtp chunt. und nah chli umparaphrisiert ums google na schwieriger z mache. bilder mache la hani mit dall-e. dall-e isch jetzt übrigens öffentlich.
jetzt mueniis na in wordpress haue und bilder richtig verhenke. mal luege wie de shit rankt bi google.
min job wird sich brutal verändere und villi anderi au:
wemme das inen workflow inegüsst, wird d erstellig vonere landingpage wo den au ahand vo date performt, es chinderspiel und nömm so ziiitufwendig fürd contenterstellig.
da es paar tools:
https://beta.tome.app/ (AI Power Point)
https://labs.openai.com/ (dall-E)
https://chat.openai.com/auth/login (chatgtp)
https://quillbot.com/ (paraphraser)
isch scho geil, chunsch dir vor wie s erst mal inere suechmaschine wott häsch chli muesse lerne wie die überhaupt funktioniert um s best resultat überchoh, promptigabe sind ähnlich.
jetzt mueniis na in wordpress haue und bilder richtig verhenke. mal luege wie de shit rankt bi google.
min job wird sich brutal verändere und villi anderi au:
wemme das inen workflow inegüsst, wird d erstellig vonere landingpage wo den au ahand vo date performt, es chinderspiel und nömm so ziiitufwendig fürd contenterstellig.
da es paar tools:
https://beta.tome.app/ (AI Power Point)
https://labs.openai.com/ (dall-E)
https://chat.openai.com/auth/login (chatgtp)
https://quillbot.com/ (paraphraser)
isch scho geil, chunsch dir vor wie s erst mal inere suechmaschine wott häsch chli muesse lerne wie die überhaupt funktioniert um s best resultat überchoh, promptigabe sind ähnlich.
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Der Softwarekonzern Microsoft will einem Medienbericht zufolge die Weiterentwicklung seine Suchmaschine Bing mithilfe der künstlichen Intelligenz (KI) der Bilderzeugungssoftware von OpenAI vorantreiben.
Microsoft könnte die neue Funktion noch vor Ende März auf den Markt bringen, berichtete die Technologie-Nachrichten-Website "The Information" am Dienstag. Das Unternehmen wolle mit der neuen Funktion dem Rivalen Google den Rang ablaufen. Microsoft kündigte im vergangenen Jahr an, die Bilderzeugungs-KI von OpenAI, bekannt als DALL-E 2, in Bing integrieren zu wollen. OpenAI lehnte eine Stellungnahme ab. Microsoft reagierte nicht sofort auf eine Anfrage von Reuters.
Microsoft könnte die neue Funktion noch vor Ende März auf den Markt bringen, berichtete die Technologie-Nachrichten-Website "The Information" am Dienstag. Das Unternehmen wolle mit der neuen Funktion dem Rivalen Google den Rang ablaufen. Microsoft kündigte im vergangenen Jahr an, die Bilderzeugungs-KI von OpenAI, bekannt als DALL-E 2, in Bing integrieren zu wollen. OpenAI lehnte eine Stellungnahme ab. Microsoft reagierte nicht sofort auf eine Anfrage von Reuters.
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
google siit 2januar mit muse https://muse-model.github.io/
- The Sheep
- VIP-Member
- Beiträge: 4684
- Registriert: 06 Okt 2010 23:37
- TRADINGPOINTS:
-
440
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
ich han mit ChatGPT die letschte zwei Wuche bitz umegspielt. Au das findi glichermasse faszinierend wie beängschtigend.
Aber au nützlich. Han AI bereits verwändet um öppertem e Wiehnachtscharte zschriebe, womer nit bsunders noch stoht, und mir par-tout kei Text igfalle isch. Für ChatGPT e Sach so weniger als 5 Sekunde
Aber au nützlich. Han AI bereits verwändet um öppertem e Wiehnachtscharte zschriebe, womer nit bsunders noch stoht, und mir par-tout kei Text igfalle isch. Für ChatGPT e Sach so weniger als 5 Sekunde

Mer chann ChatGPT bereits jetzt als Plugin für google in Browser inschtalliere. Hani churz usprobiert. Wenn öppis suechsch, bechunnsch denn ime witere Fänschter d'Meinig vo ChatGPT zuesätzlich zude reguläre Suechresultat. Ischmer allerdings scho nach wenige Minute ufe Sack gange, und denn hanis wieder deinschtalliert
Jetzt machts Zing in der Schüssel!
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Dä Chat isch rächt cool. Han em gseit, will es Spieli spiele, wo mier abwächseln, je ein Satz uufs Mal es Gschichtli schriibet. Isch super underhaltsam.
Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Zusätzlich ist bekannt, dass Google 2021 das auf neuronalen Netzen beruhende Sprachmodell LaMDA (Language Model for Dialog(ue) Applications) vorgestellt hat. LaMDA soll Chat GPT überlegen sein, die KI soll dem mittlerweile entlassenen Google-Ingenieur Blake Lemoine zufolge eine Persönlichkeit entwickelt haben und im Gespräch mit Menschen Meinungen und Ideen entwickeln können. LaMDA hätte gegenüber Chat GPT einen weiteren riesigen Vorteil: Chat GPT kann nur auf Daten zugreifen, die zurück ins Jahr 2021 reichen, während die Google-Suchmaschine seit Jahrzehnten das komplette Netz kartografiert hat und sein Sprachassistent bereits in Milliarden von Android-Geräten weltweit integriert ist. Unter diesem Blick erscheint die angedeutete Bing-Integration von Chat GPT eher als notwendig, um OpenAI irgendwie mit Google mithalten lassen zu können.
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Skynet... Judgment Day...
bald isches sowiiit...
bald isches sowiiit...
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
hüt mal alli pagetitles und videotitles und descpriptions mal mit chatgpt gmacht und live gspielt. mal luege was uswürkige uf organischs ranking sind.
- zeromeier
- The(G)net - Redakteurrrrr
- Beiträge: 17693
- Registriert: 06 Dez 2007 09:55
- TRADINGPOINTS:
-
970
- Kontaktdaten:
Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild
Endlich, hend rächt lang müsse warte.Jones hat geschrieben:Skynet... Judgment Day...
bald isches sowiiit...
Wer ist online?
Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste