Stability AI kondigt Stable Diffusion 3 aan met brede reikwijdte aan parameters

Stability heeft Stable Diffusion 3 aangekondigd. De tekst-naar-beeldgenerator is als bèta beschikbaar. Stable Diffusion 3 werkt met verschillende hoeveelheden parameters zodat de tool op verschillende soorten hardware werkt.

Stability zegt dat Stable Diffusion 3 als vroege preview beschikbaar is. Het gaat om een gesloten bèta waarvoor gebruikers zich op een wachtlijst kunnen plaatsen. Het bedrijf achter de tool zegt niet wanneer de software breder beschikbaar komt.

Stable Diffusion werkt met modellen die tussen de 800 miljoen en 8 miljard parameters bevatten. Parameters zijn het aantal verbindingen waarop Stable Diffusion een beschrijving genereert. De range die Stable Diffusion voor het derde model aanhoudt, is relatief breed. Zo had Stable Diffusion 1.0 860 miljoen parameters, meer dus dan het minimum van die nieuwste model, maar Stable Diffusion XL 1.0, dat vorig jaar uitkwam en tot nu toe het krachtigste model is, heeft 3,5 miljard parameters. Versie 3.0 zit daar daar met de reikwijdte dus zowel onder als boven.

Stable Diffusion 3

Volgens maker Stability is die breedte bedoeld om het model voor zoveel mogelijk hardwareopties aan te bieden. Met minder parameters is bijvoorbeeld veel minder krachtige hardware nodig om een afbeelding te genereren, terwijl de krachtigste variant van het model ook weer meer rekenkracht nodig heeft.

Stability zegt dat Stable Diffusion 3 een combinatie van diffusion transformer architecture en flow matching gebruikt. Het is voor het eerst dat Stable Diffusion die technieken krijgt. Diffusion transformer architecture is een proces waarbij een datamodel in kleine stukjes wordt opgebroken en gegenereerd, waardoor een afbeelding uit meerdere van die kleine stukjes wordt opgebouwd in plaats van als geheel. Flow matching is een technologie waarbij afbeeldingen beter kunnen worden gegenereerd vanuit ruis zonder de berekening constant te moeten herhalen. Dat moet de generator een stukn sneller maken.

Vooralsnog ontbreken veel technische details. Stability zegt 'binnenkort' technische papers beschikbaar te maken. Het bedrijf zegt verder nieuwe veiligheidsmaatregelen te hebben genomen zodat het model 'veilig en verantwoordelijk' kan worden gebruikt, maar zegt er niet bij hoe dat kan.

Stable Diffusion 3 2

Door Tijs Hofmans

Nieuwscoördinator

23-02-2024 • 12:42

23 Linkedin Whatsapp

Submitter: Balance

Reacties (23)

23
23
11
0
0
10
Wijzig sortering
Ben benieuwd, ik vind Midjourney er nog steeds wel kop en schouders bovenuit steken, zeker als je er fotorealistische plaatjes mee probeert te maken. Hopelijk kan Stable Diffusion dichterbij komen.
welke modellen gebruikt midjourney? die beter zijn dan stable diffusion?

[Reactie gewijzigd door Netrunner op 23 februari 2024 13:34]

Wat is je vraag precies?
Interessant, dank!
Midjourney beter dan Stable Diffusion? Dan heb je je niet genoeg verdiept in Stable Diffusion, SDXL is beter in alles, Midjourney is alleen wat makkelijker. In het AI topic hebben Tweakers prijzen gewonnen op fotografie sites met AI plaatjes :+
Ik heb nog geen enkele stable diffusion plaatje gezien die beter is dan midjourney?
Zeker v6 steekt met kop en schouders er bovenuit.
Bv
https://www.reddit.com/r/StableDiffusion/s/7Di0kdra6z
Ja dan neem je een goed gelukt Midjourney plaatje en een slecht gelukt SDXL plaatje, dat is toch geen vergelijking, deze heb ik gister zelf gemaakt en er zijn nog veel betere modellen en prompters dan ik.

https://i.imgur.com/5IQ2Vfq.png

Zoals hierboven ook gezegd, kijk eens in het AI topic van Tweakers zelf

https://gathering.tweaker...message/78177106#78177106

[Reactie gewijzigd door JDx op 24 februari 2024 16:32]

Cool, ik ben benieuwd. Sinds Bing ook plaatjes genereert heb ik niet zoveel meer met Stable Diffusion gedaan, maar ik mis de volledige controle en het gebrek aan censuur wel.
Vooral dat laatste. Laatst wou ik een cartoon maken van iemand die iets in een vuilbak gooide, en zelfs zoiets wordt tegenwoordig geblokkeerd. Geen idee wat er offensive is aan een vuilbak, misschien de inhoud?

Volledige controle is leuk en handig als je echt iets specifiek wil ontwerpen, en met dezelfde seed en compositie wil finetunen. Maar voor het genereren van een simpel plaatje niet echt nodig inderdaad.
Ik denk dat ze zoveel mogelijk het risico proberen te vermijden.
Aangezien ze het waarschijnlijk allemaal zelf nog moeilijk in de hand kunnen houden, blokkeren ze liever teveel dan te weinig.
Komt gewoon omdat het niet lokaal is, dan willen ze inderdaad zo veel mogelijk veilig houden, Stable Diffusion draait lokaal, dus daar kan je doen wat je wil. En als je wil (wat je niet moet willen voor de duidelijkheid) dan kan je daar ook dingen mee maken die niet door de beugel kunnen. Dat wil je op een openbare AI generator echt niet hebben natuurlijk.
dan kan je daar ook dingen mee maken die niet door de beugel kunnen [...] wat je niet moet willen
Dat geldt alleen bij publicatie toch? Iedereen mag fantaseren wat hij wil (en daar zit genoeg rottigheid/malligheid tussen).
Dus je hebt helemaal gelijk dat het vooral een lokaal/remote probleem is.

Maar buiten dat zeg ik toch (terwijl ik zelf ook genoeg dingen echt niet wil zien): alles mag. Het idee dat we de wereld beter maken/houden als men niet meer mag fantaseren klinkt erg eng.
Fantaseren is stap 1, daar beeldmateriaal van maken dat eenvoudig gedeeld kan worden is stap 2. Los van wat mijn mening nou precies is zit het risico in de normalisatie van het abnormale en daarmee de mogelijke verlaging van de drempel om de stap van fantasie naar realiteit te maken omdat alleen de plaatjes niet meer voor genoeg bevrediging van de fantasie zorgen.

En in die context snap ik de beperkingen ook wel weer, het is niet voor niets dat pornografisch materiaal niet in het bushokje hangt zullen we maar zeggen.

De "strijd" tussen wat ethisch wel of niet kan is van alle tijden en de lijn tussen ja en nee is niet alleen diffuus van zichzelf, maar ook nog eens onderhevig aan de tijdsgeest.
Tja, stap 2 is lang niet altijd een goed idee maar het puur om die reden te zeggen dat we alles moeten doen om die stap niet haalbaar te maken en dus stap 1 moeilijk gaan maken is geen goed idee.

Je zegt het zelf al; wat wel en niet kan is eigenlijk niet te bepalen. Wat wel en niet kan worden gepubliceerd op een bepaald medium is dat dan weer wel - omdat het medium dan de keuze maakt.
normalisatie van het abnormale
Maar denormalisatie van het het normale gebeurt ook. En voor beiden valt wat te zeggen. Verlaging van drempels lijkt een slecht idee maar juist die verlaging van de de drempel is ontstaan vanuit een wens toch?
Dat van fantasie naar realiteit gaan is onzin. Voor AI bestond er allang het "abnormale": pornografie in allerlei vormen. Daar gingen mensen ook niet van doordraaien en strafbare dingen doen (op een enkele uitzondering na misschien). Net als dat gewelddadige games er niet voor zorgen dat mensen in het echt gaan massamoorden met een semiautomatisch wapen. Een effect dat er wel kan zijn is afstomping, maar dat is tamelijk subtiel en niet sensationeel, dus wordt het niet herkend.
Ik denk dat ze zoveel mogelijk het risico proberen te vermijden.
Dat is een deel van de oorzaak.

Ze zijn inderdaad zeer defensief en willen controverse vermijden. Zo sterk zelfs dat ze te sterk ingrijpen en controverse creëren. Zo kon Bing image creation in het begin zelfs geen pride vlag tonen omdat de filters op ongeveer alles konden tilt slaan. En zo is er nu net de Google Gemini controverse waar ze overtrainen op data wilden compenseren door in de prompt diversiteit te injecteren. Wat dan weer heel wat problemen veroorzaakte.

Maar er is ook een culturele oorzaak in de censuur. Veel van de AI komt uit de VS waar men meer puriteins is. Denk bijvoorbeeld aan de David van Michelangelo die te naakt zou zijn. Dan filteren ze ook de datasets waar AI op getraind wordt volgens dezelfde zeer defensieve standaarden. Het is een hoofdoorzaak waarom AI zo slecht blijft in correcte anatomie.
Ik weet nog in de begintijd van Midjourney dat big black SUV ook niet mocht :D
Ook als je het prullenbak of vuilnisemmer noemt? Het kan zijn dat vuilbak wordt geïnterpreteerd als "vieze (schunnige) grap" of misspelling van "vuillak".

[Reactie gewijzigd door djwice op 23 februari 2024 23:23]

Cool, nu nog een AI die het invullen van de parameters voor me doet.
Dat kan best aardig hoor. ChatGPT (en andere LLM's) zijn best goed in het maken van prompts, er komen vaak vulwoorden uit die de output verbeteren maar je nog niet aan had gedacht.
Gister al ingeschreven voor de wachtlijst, hoefde geen portfolio ofzo mee te geven, enkel mijn Discord, dus ben benieuwd waar ze op selecteren, heb toch flink wat volgers en views, kon dat helaas niet meesturen.
Beetje off-topic, maar een leuk artikel over AI en de risico’s, vooral over SORA:

https://www.dpreview.com/...w-world-of-misinformation

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee