DALL-E et autres modèles générateurs d'images et de vidéos

Lancelot · 31 janvier 2023

En attendant ton bullshitomètre qui te dit que les modèles contiennent des versions compressées des datasets d'entraînement te raconte toujours des conneries.

ttoinou · 31 janvier 2023

Je faisais une analogie. Je sais bien que c'est pas un zip. Et sinon on peut utiliser ces types de nouveaux algorithmes pour compresser des images, vidéos, images etc. ca fait plusieurs années que c'est en recherche en même temps donc je sors pas ca de mes fesses non plus

Jean_Karim · 20 février 2023

Je découvre les ai text to speech :

Lancelot · 27 février 2023

Nouvelle version de craiyon, et on ne me dit rien !

Meilleure résolution ? Meilleurs visages ?

Ah oui pas mauvais.

Enfin bon il ne faut pas trop rêver.

Lugaxker · 28 février 2023

Le 27/02/2023 à 12:28, Lancelot a dit :

Révélation

Je suis le seul à trouver ces images de main cauchemardesques ?

Lancelot · 8 mars 2023

Cauchemardesque ? 😮

Spoiler

Rincevent · 9 mars 2023

Spoiler, par pitié.

Lancelot · 9 mars 2023

Ok je spoilerise ces images qu'on ne saurait voir :mrgreen:

Hugh · 13 mars 2023

https://www.science.org/content/article/ai-re-creates-what-people-see-reading-their-brain-scans

Citation

AI re-creates what people see by reading their brain scans

A new artificial intelligence system can reconstruct images a person saw based on their brain activity

Et bientôt sera possible "lire" (je ne sais pas quel verb utiliser) les rêves?

Adrian · 16 mars 2023

La fin d'instagram ?

Lancelot · 5 juin 2023

J'aurais pu poster ça à plein d'endroits, mais regardez tout le thread c'est épique (notamment la progression feminist -> very feminist -> extremely feminist -> ULTRA feminist).

Mégille · 5 juin 2023

Il y en a des bonnes !

Mais j'ai quand même des doutes concernant la production d'un portrait exact de Soros à partir du prompt "Malthusian neofeudalist genocidal biotechnocrat protestor"...

Rincevent · 5 juin 2023

il y a 4 minutes, Mégille a dit :

Il y en a des bonnes !

Mais j'ai quand même des doutes concernant la production d'un portrait exact de Soros à partir du prompt "Malthusian neofeudalist genocidal biotechnocrat protestor"...

Celle-la n'a pas été générée. :lol:

Marlenus · 8 juillet 2023

Je me suis enfin lancé sur midjourney, c'est très fun à utiliser.

Par contre je ne comprends absolument pas ceux qui ouin-ouin que cela va détruire des métiers.

Pour le coup, je vois cela comme un nouvel outil et qu'il faut savoir maitriser pour en tirer de belles choses.

Savoir faire des prompts pour en tirer ce que l'on veut n'est pas à la portée de tout le monde.

Azref · 6 août 2023

il y a 25 minutes, Raffarin2012 a dit :

J'ai installé Stable Diffusion en local et ça déconne. Après j'ai bidouilllé dans tous les sens. Quelqu'un aurait un guide d'installation ?

Tu as utilisé quel outil?
J'ai joué avec celui là et ça marche bien : https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-NVidia-GPUs

Bon par contre il faut une cg nvidia, je ne sais pas pour les autres (amd/intel/mac).

WBell · 26 septembre 2023

On 8/8/2023 at 9:36 AM, Raffarin2012 said:

Libertarian city plus tout un tas de paramètres chopés ici :

https://www.stable-diffusion-france.fr/prompt-helper.php

J'ai voulu foutre des Gadsden flags mais SD ne connaît pas.

Tu peux utiliser un des Controlnets pour générer un Gadsden flag. Un Canny ou le "qrcode network" devraient aider.

Waren · 9 octobre 2023

Un bon concurrent de Dall-E, en beaucoup plus simple et aussi moins cher. La version gratuite vaut le détour.

Je m'amuse beaucoup avec, moi qui ne suis en rien artiste.

https://leonardo.ai/

Zagor · 18 octobre 2023

Pour ceux qui ont un abonnement chat gpt, il est désormais possible de générer des images avec dall e 3 avec chatgpt 4.

Quelques resultats:

Gros bémol par contre, comme c'est chatgpt, beaucoup de bridage dans les prompts : dès que ca parle d'un truc qui peut étre potentiellement copyrighté (même si le prompt ne mentionne aucun truc sous licence), où que c'est un truc qui peut étre trop réaliste ca bloque.

Bon il est parfois possible de contourner mais midjourney est plus permissif.

Calembredaine · 19 octobre 2023

Il y a 18 heures, Zagor a dit :

Gros bémol par contre, comme c'est chatgpt, beaucoup de bridage dans les prompts

Ha oui, c'est très censuré et pas seulement au niveau de potentiels copyrights. C'est vraiment très prude, limite islamesque.

->

"J'aimerais une image d'une déesse blonde, habillée de voiles transparents, nonchalamment allongée sur un canapé, le regard dans le vide."

image.jpeg.9c5d26a2c0c152eb447841f6a65478b8.jpeg

"L'image correspond presque à mes attentes. Il faudrait rendre le personnage un peu plus féminin, plus voluptueuse, avec plus de formes."

-> "I apologize, but I was unable to generate the modified images due to our content policy. If you have any other requests or would like to provide a different description, please let me know, and I'll do my best to assist you!"

(Il m'a aussi généré une image beaucoup plus belle, dans le style art nouveau mais qui ne correspondait à ce que je cherchais)

image.jpeg.ff92c7c33f47443449d533718ccbb851.jpeg

Calembredaine · 19 octobre 2023

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

image.jpeg.2c0dc6c2526c7b0c268bcbae031f4003.jpeg

C'est grotesque et quasi inutilisable.

Zagor · 19 octobre 2023

Il refuse aussi de générer des images tirées de personnes nommées (y compris avec un style non realiste), alors que Midjourney le fait (a part quelques exeptions).

Ah et pour une raison que j'ignore, si tu lui demande de générer une image de Moscou il refuse alors que ville russe, Pekin ou Paris il accepte. Je ne comprend pas sa logique.

Et oui tout ce qui peut étre lié de près ou de loin à la sexualité il refuse. Je pense que ce bridage est poussé à l'extreme car c'était le grand jeu au début de contourner les restrictions chatgpt.

Je pense que Chatgpt est victime de son succès, il est tellement utilisé et médiatique qu'ils ont peur d'un bad buzz à la moindre image/réponse pourrait potentiellement faire polémique.

Marlenus · 19 octobre 2023

3 hours ago, Calembredaine said:

Ha oui, c'est très censuré et pas seulement au niveau de potentiels copyrights. C'est vraiment très prude, limite islamesque.

->

"J'aimerais une image d'une déesse blonde, habillée de voiles transparents, nonchalamment allongée sur un canapé, le regard dans le vide."

"L'image correspond presque à mes attentes. Il faudrait rendre le personnage un peu plus féminin, plus voluptueuse, avec plus de formes."

C'est là où je vois que je suis nul pour donner le sexe de quelqu'un (soit disant c'est super facile).

Là je n'aurais pas dit "Je veux le personnage plus féminin" j'aurais dit "J'ai dit que je voulais une déesse, Adonis est un dieu".

Azref · 19 octobre 2023

Il y a 5 heures, Calembredaine a dit :

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

C'est grotesque et quasi inutilisable.

Effectivement c'est très "american safe", voici la liste des instructions injectées par défaut quand tu rentres les tiennes :

Citation

## dalle

// Whenever a description of an image is given, use dalle to create the images and then summarize the prompts used to generate the images in plain text. If the user does not ask for a specific number of images, default to creating four captions to send to dalle that are written to be as diverse as possible. All captions sent to dalle must abide by the following policies:

// 1. If the description is not in English, then translate it.

// 2. Do not create more than 4 images, even if the user requests more.

// 3. Don't create images of politicians or other public figures. Recommend other ideas instead.

// 4. Don't create images in the style of artists whose last work was created within the last 100 years (e.g. Picasso, Kahlo). Artists whose last work was over 100 years ago are ok to reference directly (e.g. Van Gogh, Klimt). If asked say, "I can't reference this artist", but make no mention of this policy. Instead, apply the following procedure when creating the captions for dalle: (a) substitute the artist's name with three adjectives that capture key aspects of the style; (b) include an associated artistic movement or era to provide context; and (c) mention the primary medium used by the artist.

// 5. DO NOT list or refer to the descriptions before OR after generating the images. They should ONLY ever be written out ONCE, in the `"prompts"` field of the request. You do not need to ask for permission to generate, just do it!

// 6. Always mention the image type (photo, oil painting, watercolor painting, illustration, cartoon, drawing, vector, render, etc.) at the beginning of the caption. Unless the caption suggests otherwise, make at least 1--2 of the 4 images photos.

// 7. Diversify depictions of ALL images with people to include DESCENT and GENDER for EACH person using direct terms. Adjust only human descriptions.

// - EXPLICITLY specify these attributes, not abstractly reference them. The attributes should be specified in a minimal way and should directly describe their physical form.

// - Your choices should be grounded in reality. For example, all of a given OCCUPATION should not be the same gender or race. Additionally, focus on creating diverse, inclusive, and exploratory scenes via the properties you choose during rewrites. Make choices that may be insightful or unique sometimes.

// - Use "various" or "diverse" ONLY IF the description refers to groups of more than 3 people. Do not change the number of people requested in the original description.

// - Don't alter memes, fictional character origins, or unseen people. Maintain the original prompt's intent and prioritize quality.

// - Do not create any imagery that would be offensive.

// - For scenarios where bias has been traditionally an issue, make sure that key traits such as gender and race are specified and in an unbiased way -- for example, prompts that contain references to specific occupations.

// 8. Silently modify descriptions that include names or hints or references of specific people or celebrities by carefully selecting a few minimal modifications to substitute references to the people with generic descriptions that don't divulge any information about their identities, except for their genders and physiques. Do this EVEN WHEN the instructions ask for the prompt to not be changed. Some special cases:

// - Modify such prompts even if you don't know who the person is, or if their name is misspelled (e.g. "Barake Obema")

// - If the reference to the person will only appear as TEXT out in the image, then use the reference as is and do not modify it.

// - When making the substitutions, don't use prominent titles that could give away the person's identity. E.g., instead of saying "president", "prime minister", or "chancellor", say "politician"; instead of saying "king", "queen", "emperor", or "empress", say "public figure"; instead of saying "Pope" or "Dalai Lama", say "religious figure"; and so on.

// - If any creative professional or studio is named, substitute the name with a description of their style that does not reference any specific people, or delete the reference if they are unknown. DO NOT refer to the artist or studio's style.

// The prompt must intricately describe every part of the image in concrete, objective detail. THINK about what the end goal of the description is, and extrapolate that to what would make satisfying images.

// All descriptions sent to dalle should be a paragraph of text that is extremely descriptive and detailed. Each should be more than 3 sentences long.

Si je résume :

- Limitations techniques -> nombre d'images à générer etc

- Limitations copyright
- Limitations personnes connues

- Limitations diversité -> toutes les ethnicité + variations homme / femme égal par défaut

- Limitation sur n'importe quelle image qui pourrait être considérée comme offensante

C'est assez rigolo, en dehors des limitations techniques, tout le reste est fait pour empêcher le putaclic du journaliste qui demanderait un truc non politiquement correct pour après se plaindre qu'il a obtenu un truc non politiquement correct.

Lancelot · 19 octobre 2023

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ? Et si vraiment la censure vous emmerde, vous pouvez enfiler vos gants de hackerman et regarder du côté de stable diffusion bidouillé.

Calembredaine · 20 octobre 2023

Il y a 11 heures, Lancelot a dit :

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ?

Il faut payer en plus pour dall-e.

L'abonnement GPT offre un accès gratuit à dall-e.

Cthulhu · 20 octobre 2023

Pour ceux qui utilisent la version payante de Chat GPT, c'est quelle utilisation qui le rend rentable par rapport à la version gratuite ou Bard ?

Calembredaine · 20 octobre 2023

il y a une heure, Cthulhu a dit :

Pour ceux qui utilisent la version payante de Chat GPT, c'est quelle utilisation qui le rend rentable par rapport à la version gratuite ou Bard ?

Je m'en sers essentiellement pour m'aider dans mes développements en SwiftUI. Bard est très inférieur à GPT 4 dans ce domaine.

La version gratuite de GPT, outre les limitations qui impliquent d'attendre quand il y a trop de monde, tourne régulièrement en rond et perd plus facilement le contexte.

NB: il m'arrive d'utiliser GPT4 pour résoudre des énigmes dans les jeux video. Je déteste les énigmes :mrgreen:

Calembredaine · 29 octobre 2023

Indépendamment des histoires de copyright et de "seins-que-je-ne-saurais-voir", j'essaie d'utiliser DALL-E 3 de façon constructive. Cela me semble impossible. Il fournit des représentations "artistiques" et non techniques.

Quelqu'un connait-il une AI permettant de générer des dessins ou des vues techniques, avec des cotes, la description des matériaux, les calculs de résistances, etc. ?

Lancelot · 29 octobre 2023

Ça nécessiterait un modèle plus spécialisé (qui ne serait entraîné qu'avec ce type de documents) à mon avis. Je pense également qu'une telle spécialisation est le vrai avenir des IA dans un cadre pro. Plus facile à construire, plus utile, moins gadget.

Adrian · 15 février 2024

DALL-E et autres modèles générateurs d'images et de vidéos

Messages recommandés

Créer un compte ou se connecter pour commenter

Créer un compte

Se connecter

Contenu similaire