Seite 1 von 10

Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 03 Jul 2022 19:52
von The Sheep
Ob Text, Ton oder Grafik. Apps wo mit Hilf vo AI (künschtlicher Intelligänz), wasmer villicht nüchtern betrachtet au als statistisch errächneti Ergäbnis, basierend uf extrem grosse, durch Mensche erzügte Datemänge, übersetze chönnt, wärdet immer populärer. Ich möcht in däm Thread eigengtlich nit uf moralisch ethischi Betrachtige igo. Ich bin sälber Grafiker und ich find die Entwicklig mehr Fluech als Säge, aber leider isches nit ufhaltbar. Und um über d'Ängscht zrede, isch miner Meinig nach de Thread" okay, jetzt wirds langsam scary..." vom Master (G) besser geeignet.

Mich interessiert das Thema aber au praktisch. Ich möcht wüsse, was chann AI, wo sind im Momänt no ihri Gränze, und wie chann mir AI au als Grafiker nützlich si?

Es git im Momänt offebar zwei Platzhirsche im Berich Text zu Bild AI: "DALL-E 2" vo Open AI und "Imagen" vo Google. Bim erschtere hani mi im Mai fürs Beta Programm agmäldet, bin aber nonig iglade worde. Google Imagen hani kei Ahnig ob und wie mer das chann sälber teschte.

Wär sich unter däm Thema nüt chann vorstelle: Es goht ume Software wo usere x-beliebige Beschribig es Bild chann erzüge.

Als Alternative zu DALL-2 oder Imgen gits "Disco Diffusion", womer via Google Colab mehreri Stunde chann gratis teschte. Fürd Basics chani das Afängertutorial für die neuschti Version 5.4 empfähle: https://www.youtube.com/watch?v=3FVW3ewlTh0

Irgendwenn isch Google aber der Meinig gse, es seg jetzt guet mit der GPU wo sie mir bisher choschtelos zur Verfüegig gschtellt heige, und ich chönni mich ja für ColabPro (9.25$ pro Monat) oder Colab+ (42.50$ pro Monat) entscheide, wenn ich möcht witer mache. Das isch minere Meinig nach nit viel Gäld für sone Software, Disco Diffusion isch aber au weniger guet als DALL-E 2 oder Imagen. Disco Diffusion chann zwar wirklich cooli Resultat erzüge, aber mer sött wüsse, wasmer erwarte chann, und was ebe nit:

Disco Diffusion isch stark bi emotionelle Bilder wo nit der Realitet entspräche müend. Offebar verstoht die Software wie es Objekt usgseht, aber nit worum das Objekt so beschaffe isch. E Wand vome Huus mit Türe und Fänschter zB isch für Disco Diffusion ebe nur das. Es verstoht nit, dass e Wand muess sänkrächt sie wils Huus sunscht chönnt ischtürze, und e Türe muess unte sie demit Lüt chönne inelaufe. Wenn Disco Diffusion es Huus konschtruiert, chann das Huus am Schluss usgseh wie usme kafka-esque Alptraum, und es het trotzdäm alli visuelle Elemänt vomene Huus. Über Darstellige vo Mensche rede mir am beschte gar nit. Wenn nit uf groteski Missbildige stohsch, isches verschwädeti Zit.

Die meischte von dene Text zu Bild AI Apps taschte sich über dutzendi vo Arbeitsschritt ans Ändresultat ane. Wieviel Schritt notwändig sind, beschtimmsch aber nur Du. Solang du die Software nämlich mache losch, füegt sie immer mehr Details dezue. Und glaub nit, dass mehr gleich besser isch. Oft luegt mehr sich die Zwischeresultat a am Schluss, und findet en Punkt für sich, wos optimal isch gseh. Alles wo die Software nachhär produziert het, schiesst übers Ziil use.

s'wichtigschte isch aber de "prompt", dä Satz wo beschribt, was d'Software mache söll. da gits vieli DOs und DON'T's. Empfehle für Disco Diffusion channi da es Youtoube video mit viele guete Idee:
https://www.youtube.com/watch?v=w7VFkU1zM30
https://www.youtube.com/watch?v=PpX9kgTA5vk

Au ganz hilfrich:
Uf dere Website het eine 662 mol die gliche zwei Bilder rächne lo, aber jedesmal im Stil vome andere Künschtler:
https://weirdwonderfulai.art/resources/ ... t-studies/

Es paar Resultat us de erschte paar Tag woni mit Disco Diffusion umegspielt han:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 07 Jul 2022 14:17
von Moff
han letschte wuche beta access gha zu midjourney und ich finde das unglaublich beidruckend.

unvorstellbar was i dere hisicht i 10 oder 50 jahr möglich isch und wie das euse alltag veränderet

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 07 Jul 2022 16:53
von The Sheep
los, heb Bildli ine wo gmacht hesch!

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 07 Jul 2022 19:17
von The Sheep
Making the impossible impossible....

Han es Bild mit em Prompt "squaring the circle" rächne lo, also "quadratur des kreises", das bekannte Paradoxon womer mol in der Schuel glernt händ. Und ratet mal was debi usecho isch! Nüt!! ich bechum keini bruchbare Ergebnis! Jedes Bild woner erzügt, isch verschwumme! Sälbscht nach 300 Steps, wo die meischte andere Motiv bereits überlade sind mit Details...

und es goht witer: szweite Bild heisst "the meaning of life". Ebefalls nach rund 300 steps! Was isch zseh? es verschwummes nüt, mit öppis dunklem wo so usgseht wie Hebräischi Schriftzeiche... :3eyes:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 08 Jul 2022 11:17
von Vyse
Hät sich GOLEM (Also sprach Golem, Stanislaw Lem) nöd sälber abgschalte, nachdäm er sabsolute Wüsse und umfassendi Intelligänz erreicht hät? Dadruus schlüssend channs längerfrischtig kei wahri KI gäh, will so e KI dSinnlosigkeit vo allem erchänne und sich sälber uuschalte wür.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 29 Jul 2022 07:43
von The Sheep
Jetzt bini iglade worde vo openai zum teschte vo DALL-E. Jau, das isch namol en anderi Qualitet. Macht richtig Laune das Tool.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 01 Aug 2022 07:47
von The Sheep
no es paar mehr. Die Bilder sind im Fall nit reproduzierbar. DALL-E interpretiert de Text jedesmal neu.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 01 Aug 2022 09:13
von Vyse
:shock:

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 08 Aug 2022 18:51
von Mr Burzel
Meine Kunst mit Midjourney:

Bild

Bild

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 08 Aug 2022 22:12
von Jones
bi o grad am midjourney teste... es isch unfassbar!
jedem wo's zeigsch gheit dr chinnlade abe...

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 09 Aug 2022 00:04
von zeromeier
Wüki no fönny: latin girl in bikini eats pizza on a car Bild Bild

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 15 Aug 2022 08:21
von thaeye
so han au mal chli umebastlet, han aber na mueh mit gnau beschriebe. aber isch scho krass wie wiit das doch scho fängs isch.

han mi mal für Dall-E waitinglist igschriebe.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 16 Aug 2022 07:37
von Moff
Bild

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 16 Aug 2022 09:58
von thaeye
midjourney super. wie chunt me zu imagen? google glaubs na chli angst das öffentlich z teste.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 25 Aug 2022 06:39
von The Sheep
jetzt chömet 3D Designer dra. In London gits e Startup namens KAEDIM. Die händ e zimlich mächtigi Software entwicklet, wo mit Hilf vo AI chann 3D Modäll us Bilder rächne, in wenige Sekunde. Leider gsehn sie ihr Tool nit als Gschänk and Menschheit, sondern eher als Möglichkeit e hufe Gäld zschöpfe. Ihr Zahligsmodäll fangt bi 599 Dollar pro Monat a für maximal 30 Generierige und goht bis 15'000 Dollar für 1000 Generierige.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 03 Jan 2023 13:51
von thaeye
han jetzt mal mit chatgtp en landingpage baut (code haets grad usgspuckt, schon na geil, coders werdets also au schwieriger ha in zukunft) und dezue na en seo optimierte text, de ich den widrum han pruefe lah ob google bemerkt ob das vo chatgtp chunt. und nah chli umparaphrisiert ums google na schwieriger z mache. bilder mache la hani mit dall-e. dall-e isch jetzt übrigens öffentlich.

jetzt mueniis na in wordpress haue und bilder richtig verhenke. mal luege wie de shit rankt bi google.

min job wird sich brutal verändere und villi anderi au:

wemme das inen workflow inegüsst, wird d erstellig vonere landingpage wo den au ahand vo date performt, es chinderspiel und nömm so ziiitufwendig fürd contenterstellig.

da es paar tools:

https://beta.tome.app/ (AI Power Point)
https://labs.openai.com/ (dall-E)
https://chat.openai.com/auth/login (chatgtp)
https://quillbot.com/ (paraphraser)

isch scho geil, chunsch dir vor wie s erst mal inere suechmaschine wott häsch chli muesse lerne wie die überhaupt funktioniert um s best resultat überchoh, promptigabe sind ähnlich.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 04 Jan 2023 13:18
von thaeye
Der Softwarekonzern Microsoft will einem Medienbericht zufolge die Weiterentwicklung seine Suchmaschine Bing mithilfe der künstlichen Intelligenz (KI) der Bilderzeugungssoftware von OpenAI vorantreiben.
Microsoft könnte die neue Funktion noch vor Ende März auf den Markt bringen, berichtete die Technologie-Nachrichten-Website "The Information" am Dienstag. Das Unternehmen wolle mit der neuen Funktion dem Rivalen Google den Rang ablaufen. Microsoft kündigte im vergangenen Jahr an, die Bilderzeugungs-KI von OpenAI, bekannt als DALL-E 2, in Bing integrieren zu wollen. OpenAI lehnte eine Stellungnahme ab. Microsoft reagierte nicht sofort auf eine Anfrage von Reuters.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 04 Jan 2023 19:20
von thaeye
google siit 2januar mit muse https://muse-model.github.io/

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 04 Jan 2023 23:13
von The Sheep
ich han mit ChatGPT die letschte zwei Wuche bitz umegspielt. Au das findi glichermasse faszinierend wie beängschtigend.

Aber au nützlich. Han AI bereits verwändet um öppertem e Wiehnachtscharte zschriebe, womer nit bsunders noch stoht, und mir par-tout kei Text igfalle isch. Für ChatGPT e Sach so weniger als 5 Sekunde :lol:
thaeye hat geschrieben: 04 Jan 2023 13:18 Der Softwarekonzern Microsoft will einem Medienbericht zufolge die Weiterentwicklung seine Suchmaschine Bing mithilfe der künstlichen Intelligenz (KI) der Bilderzeugungssoftware von OpenAI vorantreiben.
Mer chann ChatGPT bereits jetzt als Plugin für google in Browser inschtalliere. Hani churz usprobiert. Wenn öppis suechsch, bechunnsch denn ime witere Fänschter d'Meinig vo ChatGPT zuesätzlich zude reguläre Suechresultat. Ischmer allerdings scho nach wenige Minute ufe Sack gange, und denn hanis wieder deinschtalliert

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 05 Jan 2023 13:42
von Vyse
Dä Chat isch rächt cool. Han em gseit, will es Spieli spiele, wo mier abwächseln, je ein Satz uufs Mal es Gschichtli schriibet. Isch super underhaltsam.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 09 Jan 2023 21:55
von thaeye
Zusätzlich ist bekannt, dass Google 2021 das auf neuronalen Netzen beruhende Sprachmodell LaMDA (Language Model for Dialog(ue) Applications) vorgestellt hat. LaMDA soll Chat GPT überlegen sein, die KI soll dem mittlerweile entlassenen Google-Ingenieur Blake Lemoine zufolge eine Persönlichkeit entwickelt haben und im Gespräch mit Menschen Meinungen und Ideen entwickeln können. LaMDA hätte gegenüber Chat GPT einen weiteren riesigen Vorteil: Chat GPT kann nur auf Daten zugreifen, die zurück ins Jahr 2021 reichen, während die Google-Suchmaschine seit Jahrzehnten das komplette Netz kartografiert hat und sein Sprachassistent bereits in Milliarden von Android-Geräten weltweit integriert ist. Unter diesem Blick erscheint die angedeutete Bing-Integration von Chat GPT eher als notwendig, um OpenAI irgendwie mit Google mithalten lassen zu können.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 10 Jan 2023 05:25
von zeromeier
Google, crazy.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 10 Jan 2023 08:55
von Jones
Skynet... Judgment Day...

bald isches sowiiit...

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 10 Jan 2023 14:42
von thaeye
hüt mal alli pagetitles und videotitles und descpriptions mal mit chatgpt gmacht und live gspielt. mal luege was uswürkige uf organischs ranking sind.

Re: Künschtlichi Intelligänz Apps: Text zu Text, Ton, oder Bild

Verfasst: 11 Jan 2023 00:29
von zeromeier
Jones hat geschrieben:Skynet... Judgment Day...

bald isches sowiiit...
Endlich, hend rächt lang müsse warte.