Stability AI kondigt Stable Diffusion 3 aan met brede reikwijdte aan parameters

Stability heeft Stable Diffusion 3 aangekondigd. De tekst-naar-beeldgenerator is als bèta beschikbaar. Stable Diffusion 3 werkt met verschillende hoeveelheden parameters zodat de tool op verschillende soorten hardware werkt.

Stability zegt dat Stable Diffusion 3 als vroege preview beschikbaar is. Het gaat om een gesloten bèta waarvoor gebruikers zich op een wachtlijst kunnen plaatsen. Het bedrijf achter de tool zegt niet wanneer de software breder beschikbaar komt.

Stable Diffusion werkt met modellen die tussen de 800 miljoen en 8 miljard parameters bevatten. Parameters zijn het aantal verbindingen waarop Stable Diffusion een beschrijving genereert. De range die Stable Diffusion voor het derde model aanhoudt, is relatief breed. Zo had Stable Diffusion 1.0 860 miljoen parameters, meer dus dan het minimum van die nieuwste model, maar Stable Diffusion XL 1.0, dat vorig jaar uitkwam en tot nu toe het krachtigste model is, heeft 3,5 miljard parameters. Versie 3.0 zit daar daar met de reikwijdte dus zowel onder als boven.

Stable Diffusion 3

Volgens maker Stability is die breedte bedoeld om het model voor zoveel mogelijk hardwareopties aan te bieden. Met minder parameters is bijvoorbeeld veel minder krachtige hardware nodig om een afbeelding te genereren, terwijl de krachtigste variant van het model ook weer meer rekenkracht nodig heeft.

Stability zegt dat Stable Diffusion 3 een combinatie van diffusion transformer architecture en flow matching gebruikt. Het is voor het eerst dat Stable Diffusion die technieken krijgt. Diffusion transformer architecture is een proces waarbij een datamodel in kleine stukjes wordt opgebroken en gegenereerd, waardoor een afbeelding uit meerdere van die kleine stukjes wordt opgebouwd in plaats van als geheel. Flow matching is een technologie waarbij afbeeldingen beter kunnen worden gegenereerd vanuit ruis zonder de berekening constant te moeten herhalen. Dat moet de generator een stukn sneller maken.

Vooralsnog ontbreken veel technische details. Stability zegt 'binnenkort' technische papers beschikbaar te maken. Het bedrijf zegt verder nieuwe veiligheidsmaatregelen te hebben genomen zodat het model 'veilig en verantwoordelijk' kan worden gebruikt, maar zegt er niet bij hoe dat kan.

Stable Diffusion 3 2

Lees meer

IT-banen

Reacties (23)

Rixos
23 februari 2024 12:51

Ben benieuwd, ik vind Midjourney er nog steeds wel kop en schouders bovenuit steken, zeker als je er fotorealistische plaatjes mee probeert te maken. Hopelijk kan Stable Diffusion dichterbij komen.

Netrunner
@Rixos • 23 februari 2024 13:33

welke modellen gebruikt midjourney? die beter zijn dan stable diffusion?

[Reactie gewijzigd door Netrunner op 23 februari 2024 13:34]

Rixos
@Netrunner • 23 februari 2024 13:51

Wat is je vraag precies?

JDx

Kunstmatige intelligentie

@Rixos • 23 februari 2024 14:01

Ik zou zeggen, neem eens een kijkje in het AI topic
forumtopic: Het grote AI art show- & kletstopic

Rixos
@JDx • 23 februari 2024 16:03

Interessant, dank!

JDx

Kunstmatige intelligentie

@Rixos • 23 februari 2024 13:52

Midjourney beter dan Stable Diffusion? Dan heb je je niet genoeg verdiept in Stable Diffusion, SDXL is beter in alles, Midjourney is alleen wat makkelijker. In het AI topic hebben Tweakers prijzen gewonnen op fotografie sites met AI plaatjes

mannowlahn
@JDx • 24 februari 2024 16:16

Ik heb nog geen enkele stable diffusion plaatje gezien die beter is dan midjourney?
Zeker v6 steekt met kop en schouders er bovenuit.
Bv
https://www.reddit.com/r/StableDiffusion/s/7Di0kdra6z

JDx

Kunstmatige intelligentie

@mannowlahn • 24 februari 2024 16:31

Ja dan neem je een goed gelukt Midjourney plaatje en een slecht gelukt SDXL plaatje, dat is toch geen vergelijking, deze heb ik gister zelf gemaakt en er zijn nog veel betere modellen en prompters dan ik.

https://i.imgur.com/5IQ2Vfq.png

Zoals hierboven ook gezegd, kijk eens in het AI topic van Tweakers zelf

https://gathering.tweaker...message/78177106#78177106

[Reactie gewijzigd door JDx op 24 februari 2024 16:32]

ErikT738
23 februari 2024 12:49

Cool, ik ben benieuwd. Sinds Bing ook plaatjes genereert heb ik niet zoveel meer met Stable Diffusion gedaan, maar ik mis de volledige controle en het gebrek aan censuur wel.

Mavamaarten

@ErikT738 • 23 februari 2024 12:58

Vooral dat laatste. Laatst wou ik een cartoon maken van iemand die iets in een vuilbak gooide, en zelfs zoiets wordt tegenwoordig geblokkeerd. Geen idee wat er offensive is aan een vuilbak, misschien de inhoud?

Volledige controle is leuk en handig als je echt iets specifiek wil ontwerpen, en met dezelfde seed en compositie wil finetunen. Maar voor het genereren van een simpel plaatje niet echt nodig inderdaad.

IamPeacock
@Mavamaarten • 23 februari 2024 13:14

Ik denk dat ze zoveel mogelijk het risico proberen te vermijden.
Aangezien ze het waarschijnlijk allemaal zelf nog moeilijk in de hand kunnen houden, blokkeren ze liever teveel dan te weinig.

JDx

Kunstmatige intelligentie

@IamPeacock • 23 februari 2024 14:06

Komt gewoon omdat het niet lokaal is, dan willen ze inderdaad zo veel mogelijk veilig houden, Stable Diffusion draait lokaal, dus daar kan je doen wat je wil. En als je wil (wat je niet moet willen voor de duidelijkheid) dan kan je daar ook dingen mee maken die niet door de beugel kunnen. Dat wil je op een openbare AI generator echt niet hebben natuurlijk.

Tintel
@JDx • 23 februari 2024 14:33

dan kan je daar ook dingen mee maken die niet door de beugel kunnen [...] wat je niet moet willen

Dat geldt alleen bij publicatie toch? Iedereen mag fantaseren wat hij wil (en daar zit genoeg rottigheid/malligheid tussen).
Dus je hebt helemaal gelijk dat het vooral een lokaal/remote probleem is.

Maar buiten dat zeg ik toch (terwijl ik zelf ook genoeg dingen echt niet wil zien): alles mag. Het idee dat we de wereld beter maken/houden als men niet meer mag fantaseren klinkt erg eng.

Neo_TGP
@Tintel • 23 februari 2024 14:49

Fantaseren is stap 1, daar beeldmateriaal van maken dat eenvoudig gedeeld kan worden is stap 2. Los van wat mijn mening nou precies is zit het risico in de normalisatie van het abnormale en daarmee de mogelijke verlaging van de drempel om de stap van fantasie naar realiteit te maken omdat alleen de plaatjes niet meer voor genoeg bevrediging van de fantasie zorgen.

En in die context snap ik de beperkingen ook wel weer, het is niet voor niets dat pornografisch materiaal niet in het bushokje hangt zullen we maar zeggen.

De "strijd" tussen wat ethisch wel of niet kan is van alle tijden en de lijn tussen ja en nee is niet alleen diffuus van zichzelf, maar ook nog eens onderhevig aan de tijdsgeest.

Tintel
@Neo_TGP • 23 februari 2024 16:57

Tja, stap 2 is lang niet altijd een goed idee maar het puur om die reden te zeggen dat we alles moeten doen om die stap niet haalbaar te maken en dus stap 1 moeilijk gaan maken is geen goed idee.

Je zegt het zelf al; wat wel en niet kan is eigenlijk niet te bepalen. Wat wel en niet kan worden gepubliceerd op een bepaald medium is dat dan weer wel - omdat het medium dan de keuze maakt.

normalisatie van het abnormale

Maar denormalisatie van het het normale gebeurt ook. En voor beiden valt wat te zeggen. Verlaging van drempels lijkt een slecht idee maar juist die verlaging van de de drempel is ontstaan vanuit een wens toch?

Atomsk
@Neo_TGP • 24 februari 2024 02:34

Dat van fantasie naar realiteit gaan is onzin. Voor AI bestond er allang het "abnormale": pornografie in allerlei vormen. Daar gingen mensen ook niet van doordraaien en strafbare dingen doen (op een enkele uitzondering na misschien). Net als dat gewelddadige games er niet voor zorgen dat mensen in het echt gaan massamoorden met een semiautomatisch wapen. Een effect dat er wel kan zijn is afstomping, maar dat is tamelijk subtiel en niet sensationeel, dus wordt het niet herkend.

87Dave
@IamPeacock • 23 februari 2024 15:38

Ik denk dat ze zoveel mogelijk het risico proberen te vermijden.

Dat is een deel van de oorzaak.

Ze zijn inderdaad zeer defensief en willen controverse vermijden. Zo sterk zelfs dat ze te sterk ingrijpen en controverse creëren. Zo kon Bing image creation in het begin zelfs geen pride vlag tonen omdat de filters op ongeveer alles konden tilt slaan. En zo is er nu net de Google Gemini controverse waar ze overtrainen op data wilden compenseren door in de prompt diversiteit te injecteren. Wat dan weer heel wat problemen veroorzaakte.

Maar er is ook een culturele oorzaak in de censuur. Veel van de AI komt uit de VS waar men meer puriteins is. Denk bijvoorbeeld aan de David van Michelangelo die te naakt zou zijn. Dan filteren ze ook de datasets waar AI op getraind wordt volgens dezelfde zeer defensieve standaarden. Het is een hoofdoorzaak waarom AI zo slecht blijft in correcte anatomie.

JDx

Kunstmatige intelligentie

@Mavamaarten • 23 februari 2024 14:07

Ik weet nog in de begintijd van Midjourney dat big black SUV ook niet mocht

djwice
@Mavamaarten • 23 februari 2024 23:23

Ook als je het prullenbak of vuilnisemmer noemt? Het kan zijn dat vuilbak wordt geïnterpreteerd als "vieze (schunnige) grap" of misspelling van "vuillak".

[Reactie gewijzigd door djwice op 23 februari 2024 23:23]

newq
23 februari 2024 12:52

Cool, nu nog een AI die het invullen van de parameters voor me doet.

Mavamaarten

@newq • 23 februari 2024 23:52

Dat kan best aardig hoor. ChatGPT (en andere LLM's) zijn best goed in het maken van prompts, er komen vaak vulwoorden uit die de output verbeteren maar je nog niet aan had gedacht.

JDx

Kunstmatige intelligentie

23 februari 2024 13:39

Gister al ingeschreven voor de wachtlijst, hoefde geen portfolio ofzo mee te geven, enkel mijn Discord, dus ben benieuwd waar ze op selecteren, heb toch flink wat volgers en views, kon dat helaas niet meesturen.

honey
23 februari 2024 13:55

Beetje off-topic, maar een leuk artikel over AI en de risico’s, vooral over SORA:

https://www.dpreview.com/...w-world-of-misinformation

Op dit item kan niet meer gereageerd worden.

Stability AI kondigt Stable Diffusion 3 aan met brede reikwijdte aan parameters

Lees meer

IT-banen

Reacties (23)

Sorteer op:

Weergave:

Tweakers maakt gebruik van cookies

Toestemming beheren

Functioneel en analytisch

Relevantere advertenties

Ingesloten content van derden