DALL-E et autres modèles générateurs d'images et de vidéos

Raffarin2012 · 1 novembre 2022

"Liberty is in danger"

Sekonda · 12 novembre 2022

Les progrès d'une version à l'autre. Voir les tweets suivants aussi.

Pelerin Dumont · 12 novembre 2022

il y a 37 minutes, Sekonda a dit :

Les progrès d'une version à l'autre. Voir les tweets suivants aussi.

On a fait de pareils essais sur le Discord

Adrian · 12 novembre 2022

Le 12/11/2022 à 13:57, Pelerin Dumont a dit :

On a fait de pareils essais sur le Discord

Mais on a épuisé la version gratuite en 2 heures

Me MP si des gens sont intéressés par le Discord.

Bézoukhov · 16 novembre 2022

Tiens, ça me fait penser ; si certains n'ont rien à faire de leur réputation et sont capables de lever quelques dizaines de millions. Le business model du futur, c'est probablement la pornographie générée par AI. Tu tapes ton scénario dans la barre de recherche et ça te génère une vidéo.

Rincevent · 16 novembre 2022

il y a 29 minutes, Bézoukhov a dit :

Tiens, ça me fait penser ; si certains n'ont rien à faire de leur réputation et sont capables de lever quelques dizaines de millions. Le business model du futur, c'est probablement la pornographie générée par AI. Tu tapes ton scénario dans la barre de recherche et ça te génère une vidéo.

Compte tenu des avancées, ça risque d'arriver pour les femmes avant d'arriver pour les hommes (en d'autres termes, le texte est plus aisé que la vidéo).

Mégille · 17 novembre 2022

Vu la gueule des mains, parfois encore des visages, et des corps lorsqu'ils sont dans des positions inhabituelles... Il vaut mieux attendre encore un peu pour le IA porn !

ttoinou · 17 novembre 2022

Its not a bug its a feature Ca donnera lieu à de nouveaux kinks

Lancelot · 17 novembre 2022

Il faut spécifier ce dont vous parlez, mais des trucs du genre "dessin non photoréaliste de pin-up qui pose de manière pas trop complexe" ça existe déjà. Je n'ai aucun doute que quelqu'un quelque part entraîne une version de stable diffusion sur des "poses complexes", quand au "non photoréaliste" l'uncanny valley se réduit de jour en jour. Pour l'animation on est aux balbutiements mais il y a de quoi répondre à des prompts comme "génère la frame suivante sachant que la caméra à fait tel mouvement".

Raffarin2012 · 17 novembre 2022

DALL·E goes commercial, but what about copyright? (l'auteur est un spécialiste de la propriété intellectuelle)

https://www.technollama.co.uk/dall%C2%B7e-goes-commercial-but-what-about-copyright

Jesrad · 17 novembre 2022

J’attends depuis longtemps ce moment fatal pour le concept de propriété intellectuelle où tout le monde aura accès à des générateurs de contenu tendant à produire la même chose dans les mêmes circonstances Toutes les franchises auront leur litanie de déclinaisons de fan-fictions de qualité comparable au canon, tous les chanteurs à la mode auront de parfaits clones artificiels (y compris ceux morts depuis longtemps), tous les genres musicaux seront explorés et répliqués à l’infini…

NoName · 17 novembre 2022

Bienvenue dans la Post-scARTcity

Bon et pour le prono je suis déjà sur un serveur discord de waifu générées par SD donx bon.

Killer app ça sera generation de porn par formulaire (nb de participants, durée, physiques, visages, ethnicities, kink, pratiques, décor, etc...) et vu les avancées que je vois sur l'IA je pense qu'on est à moins de 10 ans. Pratiquement toutes les semaines, entre les languages models et les générateurs d'images, je vois des trucs hallucinant que j'aurais cru nécessiter encore 15 ans avant d'arriver.

J'ai l'impression qu'on vient juste de passer le bord de la crête et qu'on est pile poil à la fin du "gradually" et au début du "suddenly"

ttoinou · 17 novembre 2022

N'oubliez pas que l'IA est basé sur du contenu humain, en l'occurence ici la description textuelle de ce qu'il se passe dans le contenu.

il y a 24 minutes, NoName a dit :

Killer app ça sera generation de porn par formulaire (nb de participants, durée, physiques, visages, ethnicities, kink, pratiques, décor, etc...) et vu les avancées que je vois sur l'IA je pense qu'on est à moins de 10 ans. Pratiquement toutes les semaines, entre les languages models et les générateurs d'images, je vois des trucs hallucinant que j'aurais cru nécessiter encore 15 ans avant d'arriver.

Avec du contenu en entrée proprement décrit, vu les améliorations en GPU je dirais d'ici 2 ans un contenu un peu bizarre, d'ici 4 ans quelque chose de réaliste

Raffarin2012 · 18 novembre 2022

Raffarin2012 · 18 novembre 2022

Chez moi, pas besoin d'utiliser Photoshop ou Gimp, le watermark disparaît point barre.

Avant (voir en bas à droite) :

Après :

Raffarin2012 · 18 novembre 2022

Quant à savoir si on a le droit de publier une image sans le watermark, la réponse est floue.

Edit : c'est ok.

Citation

Commercialization Questions

Can I remove the watermark?
Yes.

https://help.openai.com/en/articles/6468065-dall-e-content-policy-faq

Et pour les crédits :

Citation

If you'd like to cite DALL·E, we'd recommend including wording such as "This image was created with the assistance of DALL·E 2" or "This image was generated with the assistance of AI."

https://help.openai.com/en/articles/6468065-dall-e-content-policy-faq

Azref · 18 novembre 2022

J'ai vu des trucs assez impressionnants générés, que ce soit dans un style photoréaliste, ou "dessiné", mais peut-on imaginer le même type de technologies appliqué à la musique?

De même que taper "Personnage dans le style d'Akira" peut donner un truc sympa, "musique jazz" par exemple?

J'ai cru comprendre que le principal soucis est la description des données d'entrée, et autant pour une image je vois bien comment on arrive à quelque chose de bien décrit, comment faire pour du son?

Lancelot · 18 novembre 2022

38 minutes ago, Azref said:

peut-on imaginer le même type de technologies appliqué à la musique?

Ça existe : https://www.unite.ai/best-ai-music-generators/

Azref · 18 novembre 2022

il y a 9 minutes, Lancelot a dit :

Ça existe : https://www.unite.ai/best-ai-music-generators/

Haha évidemment ça existe déjà, merci je vais regarder ça.

Lancelot · 20 novembre 2022

Ma découverte de prompt du jour :

Spoiler

It just works, ça sort des illustrations d'horreur à la pelle. Alors que "sunny uncanny valley" donne juste des visages et "cloudy uncanny valley" donne juste des nuages.

Lancelot · 20 novembre 2022

Don't worry, there's nothing under your bed.

Lancelot · 24 novembre 2022

Alors celui-ci est un peu technique.

Dans un modèle comme DALL-E, on a en input une image de bruit visuel et un prompt. Grossièrement, le modèle marche en "essayant de voir" le prompt dans le bruit pour arriver à une image finale. Mon questionnement était le suivant : le modèle a-t-il un point fixe ? En d'autres termes, existe-t-il un prompt tel que l'image finale soit la même que le bruit initial ? Je pense que si on prend la question au sens strict la réponse est non. Par contre on peut essayer de trouver un prompt qui transforme le bruit visuel initial en un autre bruit visuel (une sorte de point fixe perceptuel). Il se trouve que c'est assez difficile parce que le modèle a très envie d'ajouter de la structure.

Voici mon meilleur exemple pour l'instant :

Pour comparaison :

0*v12mDJwIKWn-_y8L.png

Lancelot · 24 novembre 2022

J'étais fier de moi mais évidemment ça existe déjà en mieux : https://www.aiprompt.io/

WBell · 27 novembre 2022

Stablediffusion est en release 2.0

Part rapport aux versions 1.X, ils ont supprimé beaucoup d'images NSFW, ainsi que les artistes numériques trop connus.

Les gens râlent : par effet de bord, ça empêche le modèle de construire des représentations "efficaces" des humains (par manque d'images où on voit "l'anatomie", sans que ça soit du porn).

Adrian · 27 novembre 2022

Alchimi · 12 décembre 2022

Étant enfant j'avais lu une nouvelle de SF d'un auteur classique, impossible de me souvenir de l'auteur (c'était peut être Asimov?) ou du titre de la nouvelle, qui grosso modo portait sur un robot (ou une AI?) qui devenait tellement bon à l'art qu'il jouait mieux que n'importe quel humain, (je crois que c'était du piano, mais je ne suis plus sûr, ça remonte). Je me souviens qu'enfant j'avais compris que ça portait sur la question de savoir si les humains écouteraient encore d'autres humains interpréter de la musique si une machine peut le faire mieux... Je me souviens que j'avais trouvé ça glaçant.

Un liborgien arriverait-il a identifier la nouvelle? J'aimerais la relire. C'est certainement un auteur anglophone, probablement US.

Mobius · 13 décembre 2022

"

"Randian Hero"+ "Movie poster"

Alchimi · 21 décembre 2022

J'avais entendu que les signatures d'artistes dont les œuvres avaient été pompées pour les databases d'IA ressurgissaient en artefact dans les images de synthèses.

En retestant vite fait, je viens d'en voir une occurrence, regardez en bas à droite.

signature.jpeg.a1ceb207e05869ebe24699772ac079cd.jpeg

Lancelot · 21 décembre 2022

Avicsshsesivrglincsbioir, mon artiste préféré :mrgreen:

Bon oui ça montre que les watermarks sont un élément suffisamment saillant dans la base de données d'entraînement pour que leur existence soit reflétée dans le modèle. Ce qui peut être un problème ou pas selon la perspective (est-ce qu'un copyright peut empêcher de regarder une œuvre ou de s'en inspirer ?).

Alchimi · 21 décembre 2022

spectateur/inspiration =! utilisation de propriété privée d'une autre personne.

Je sais que ça défrise certains communistes.

DALL-E et autres modèles générateurs d'images et de vidéos

Messages recommandés

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Lien vers le commentaire

Créer un compte ou se connecter pour commenter

Créer un compte

Se connecter

Contenu similaire