Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Trash-Talk pur! Alles andere als Videogames...

Moderator: Avenger

Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

Ob Text, Ton oder Grafik. Apps wo mit Hilf vo AI (künschtlicher Intelligänz), wasmer villicht nüchtern betrachtet au als statistisch errächneti Ergäbnis, basierend uf extrem grosse, durch Mensche erzügte Datemänge, übersetze chönnt, wärdet immer populärer. Ich möcht in däm Thread eigengtlich nit uf moralisch ethischi Betrachtige igo. Ich bin sälber Grafiker und ich find die Entwicklig mehr Fluech als Säge, aber leider isches nit ufhaltbar. Und um über d'Ängscht zrede, isch miner Meinig nach de Thread" okay, jetzt wirds langsam scary..." vom Master (G) besser geeignet.

Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?

Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.

Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.

Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0

Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:

Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.

Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.

s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk

Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/

Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han:
Dateianhänge
medieval_city.jpg
Lighthouse1.jpg
IndianFort.jpg
Steampunk_Spaceship.jpg
Basel_Retrofuture2.jpg
Jetzt machts Zing in der Schüssel!
Benutzeravatar
Moff
PC Gaming Master Race
PC Gaming Master Race
Beiträge: 12839
Registriert: 05 Mär 2002 18:03
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Moff »

han letschte wuche beta access gha zu midjourney und ich finde das unglaublich beidruckend.

unvorstellbar was i dere hisicht i 10 oder 50 jahr möglich isch und wie das euse alltag veränderet
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

los, heb Bildli ine wo gmacht hesch!
Jetzt machts Zing in der Schüssel!
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

Making the impossible impossible....

Han es Bild mit em Prompt "squaring the circle" rächne lo, also "quadratur des kreises", das bekannte Paradoxon womer mol in der Schuel glernt händ. Und ratet mal was debi usecho isch! Nüt!! ich bechum keini bruchbare Ergebnis! Jedes Bild woner erzügt, isch verschwumme! Sälbscht nach 300 Steps, wo die meischte andere Motiv bereits überlade sind mit Details...

und es goht witer: szweite Bild heisst "the meaning of life". Ebefalls nach rund 300 steps! Was isch zseh? es verschwummes nüt, mit öppis dunklem wo so usgseht wie Hebräischi Schriftzeiche... :3eyes:
Dateianhänge
making the impossible - impossible.jpg
Zuletzt geändert von The Sheep am 08 Jul 2022 14:17, insgesamt 1-mal geändert.
Jetzt machts Zing in der Schüssel!
Benutzeravatar
Vyse
VIP-Member
VIP-Member
Beiträge: 5391
Registriert: 07 Okt 2010 09:27
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Vyse »

Hät sich GOLEM (Also sprach Golem, Stanislaw Lem) nöd sälber abgschalte, nachdäm er sabsolute Wüsse und umfassendi Intelligänz erreicht hät? Dadruus schlüssend channs längerfrischtig kei wahri KI gäh, will so e KI dSinnlosigkeit vo allem erchänne und sich sälber uuschalte wür.
Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

Jetzt bini iglade worde vo openai zum teschte vo DALL-E. Jau, das isch namol en anderi Qualitet. Macht richtig Laune das Tool.
Dateianhänge
Screenshot 2022-07-30 at 00-15-32 DALL·E.png
Screenshot 2022-07-30 at 00-16-00 DALL·E.png
Screenshot 2022-07-30 at 00-16-25 DALL·E.png
Screenshot 2022-07-30 at 00-17-54 DALL·E.png
Screenshot 2022-07-30 at 00-18-12 DALL·E.png
Screenshot 2022-07-30 at 00-19-13 DALL·E.png
Screenshot 2022-07-30 at 00-19-42 DALL·E.png
Screenshot 2022-07-30 at 00-20-57 DALL·E.png
Jetzt machts Zing in der Schüssel!
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

no es paar mehr. Die Bilder sind im Fall nit reproduzierbar. DALL-E interpretiert de Text jedesmal neu.
Dateianhänge
Screenshot 2022-07-31 at 11-27-53 DALL·E.png
Screenshot 2022-07-31 at 11-28-41 DALL·E.png
Screenshot 2022-08-01 at 09-47-32 DALL·E.png
Screenshot 2022-08-01 at 09-15-54 DALL·E.png
Screenshot 2022-08-01 at 09-22-18 DALL·E.png
Screenshot 2022-08-01 at 09-45-17 DALL·E.png
Jetzt machts Zing in der Schüssel!
Benutzeravatar
Vyse
VIP-Member
VIP-Member
Beiträge: 5391
Registriert: 07 Okt 2010 09:27
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Vyse »

:shock:
Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
Benutzeravatar
Mr Burzel
VIP-Member
VIP-Member
Beiträge: 1637
Registriert: 16 Mär 2006 08:28
Wohnort: /dev/null
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Mr Burzel »

Meine Kunst mit Midjourney:

Bild

Bild
Benutzeravatar
Jones
VIP-Member
VIP-Member
Beiträge: 22435
Registriert: 23 Jan 2003 09:03
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Jones »

bi o grad am midjourney teste... es isch unfassbar!
jedem wo's zeigsch gheit dr chinnlade abe...
Benutzeravatar
zeromeier
The(G)net - Redakteurrrrr
The(G)net - Redakteurrrrr
Beiträge: 17310
Registriert: 06 Dez 2007 09:55
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von zeromeier »

Wüki no fönny: latin girl in bikini eats pizza on a car Bild Bild
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

so han au mal chli umebastlet, han aber na mueh mit gnau beschriebe. aber isch scho krass wie wiit das doch scho fängs isch.

han mi mal für Dall-E waitinglist igschriebe.
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

midjourney super. wie chunt me zu imagen? google glaubs na chli angst das öffentlich z teste.
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

jetzt chömet 3D Designer dra. In London gits e Startup namens KAEDIM. Die händ e zimlich mächtigi Software entwicklet, wo mit Hilf vo AI chann 3D Modäll us Bilder rächne, in wenige Sekunde. Leider gsehn sie ihr Tool nit als Gschänk and Menschheit, sondern eher als Möglichkeit e hufe Gäld zschöpfe. Ihr Zahligsmodäll fangt bi 599 Dollar pro Monat a für maximal 30 Generierige und goht bis 15'000 Dollar für 1000 Generierige.
Dateianhänge
Kaedim (1).jpg
Jetzt machts Zing in der Schüssel!
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

han jetzt mal mit chatgtp en landingpage baut (code haets grad usgspuckt, schon na geil, coders werdets also au schwieriger ha in zukunft) und dezue na en seo optimierte text, de ich den widrum han pruefe lah ob google bemerkt ob das vo chatgtp chunt. und nah chli umparaphrisiert ums google na schwieriger z mache. bilder mache la hani mit dall-e. dall-e isch jetzt übrigens öffentlich.

jetzt mueniis na in wordpress haue und bilder richtig verhenke. mal luege wie de shit rankt bi google.

min job wird sich brutal verändere und villi anderi au:

wemme das inen workflow inegüsst, wird d erstellig vonere landingpage wo den au ahand vo date performt, es chinderspiel und nömm so ziiitufwendig fürd contenterstellig.

da es paar tools:

https://beta.tome.app/ (AI Power Point)
https://labs.openai.com/ (dall-E)
https://chat.openai.com/auth/login (chatgtp)
https://quillbot.com/ (paraphraser)

isch scho geil, chunsch dir vor wie s erst mal inere suechmaschine wott häsch chli muesse lerne wie die überhaupt funktioniert um s best resultat überchoh, promptigabe sind ähnlich.
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

Der Softwarekonzern Microsoft will einem Medienbericht zufolge die Weiterentwicklung seine Suchmaschine Bing mithilfe der künstlichen Intelligenz (KI) der Bilderzeugungssoftware von OpenAI vorantreiben.
Microsoft könnte die neue Funktion noch vor Ende März auf den Markt bringen, berichtete die Technologie-Nachrichten-Website "The Information" am Dienstag. Das Unternehmen wolle mit der neuen Funktion dem Rivalen Google den Rang ablaufen. Microsoft kündigte im vergangenen Jahr an, die Bilderzeugungs-KI von OpenAI, bekannt als DALL-E 2, in Bing integrieren zu wollen. OpenAI lehnte eine Stellungnahme ab. Microsoft reagierte nicht sofort auf eine Anfrage von Reuters.
Benutzeravatar
The Sheep
VIP-Member
VIP-Member
Beiträge: 4500
Registriert: 06 Okt 2010 23:37
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von The Sheep »

ich han mit ChatGPT die letschte zwei Wuche bitz umegspielt. Au das findi glichermasse faszinierend wie beängschtigend.

Aber au nützlich. Han AI bereits verwändet um öppertem e Wiehnachtscharte zschriebe, womer nit bsunders noch stoht, und mir par-tout kei Text igfalle isch. Für ChatGPT e Sach so weniger als 5 Sekunde :lol:
thaeye hat geschrieben: 04 Jan 2023 13:18 Der Softwarekonzern Microsoft will einem Medienbericht zufolge die Weiterentwicklung seine Suchmaschine Bing mithilfe der künstlichen Intelligenz (KI) der Bilderzeugungssoftware von OpenAI vorantreiben.
Mer chann ChatGPT bereits jetzt als Plugin für google in Browser inschtalliere. Hani churz usprobiert. Wenn öppis suechsch, bechunnsch denn ime witere Fänschter d'Meinig vo ChatGPT zuesätzlich zude reguläre Suechresultat. Ischmer allerdings scho nach wenige Minute ufe Sack gange, und denn hanis wieder deinschtalliert
Jetzt machts Zing in der Schüssel!
Benutzeravatar
Vyse
VIP-Member
VIP-Member
Beiträge: 5391
Registriert: 07 Okt 2010 09:27
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Vyse »

Dä Chat isch rächt cool. Han em gseit, will es Spieli spiele, wo mier abwächseln, je ein Satz uufs Mal es Gschichtli schriibet. Isch super underhaltsam.
Wäre unsere Zivilisation ein Pferd, hätte man es schon lange erschossen.
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

Zusätzlich ist bekannt, dass Google 2021 das auf neuronalen Netzen beruhende Sprachmodell LaMDA (Language Model for Dialog(ue) Applications) vorgestellt hat. LaMDA soll Chat GPT überlegen sein, die KI soll dem mittlerweile entlassenen Google-Ingenieur Blake Lemoine zufolge eine Persönlichkeit entwickelt haben und im Gespräch mit Menschen Meinungen und Ideen entwickeln können. LaMDA hätte gegenüber Chat GPT einen weiteren riesigen Vorteil: Chat GPT kann nur auf Daten zugreifen, die zurück ins Jahr 2021 reichen, während die Google-Suchmaschine seit Jahrzehnten das komplette Netz kartografiert hat und sein Sprachassistent bereits in Milliarden von Android-Geräten weltweit integriert ist. Unter diesem Blick erscheint die angedeutete Bing-Integration von Chat GPT eher als notwendig, um OpenAI irgendwie mit Google mithalten lassen zu können.
Benutzeravatar
Jones
VIP-Member
VIP-Member
Beiträge: 22435
Registriert: 23 Jan 2003 09:03
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von Jones »

Skynet... Judgment Day...

bald isches sowiiit...
Benutzeravatar
thaeye
VIP-Member
VIP-Member
Beiträge: 16529
Registriert: 06 Okt 2010 23:28
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von thaeye »

hüt mal alli pagetitles und videotitles und descpriptions mal mit chatgpt gmacht und live gspielt. mal luege was uswürkige uf organischs ranking sind.
Benutzeravatar
zeromeier
The(G)net - Redakteurrrrr
The(G)net - Redakteurrrrr
Beiträge: 17310
Registriert: 06 Dez 2007 09:55
Kontaktdaten:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Beitrag von zeromeier »

Jones hat geschrieben:Skynet... Judgment Day...

bald isches sowiiit...
Endlich, hend rächt lang müsse warte.
Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 35 Gäste