Aller au contenu

DALL-E et autres modèles générateurs d'images et de vidéos


Messages recommandés

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

image.jpeg.2c0dc6c2526c7b0c268bcbae031f4003.jpeg

 

 

C'est grotesque et quasi inutilisable.

  • Haha 2
Lien vers le commentaire

Il refuse aussi de générer des images tirées de personnes nommées (y compris avec un style non realiste), alors que Midjourney le fait (a part quelques exeptions).

Ah et pour une raison que j'ignore, si tu lui demande de générer une image de Moscou il refuse alors que ville russe, Pekin ou Paris il accepte. Je ne comprend pas sa logique.

 

Et oui tout ce qui peut étre lié de près ou de loin à la sexualité il refuse. Je pense que ce bridage est poussé à l'extreme car c'était le grand jeu au début de contourner les restrictions chatgpt.

Je pense que Chatgpt est victime de son succès, il est tellement utilisé et médiatique qu'ils ont peur d'un bad buzz à la moindre image/réponse pourrait potentiellement faire polémique.

Lien vers le commentaire
3 hours ago, Calembredaine said:

 

Ha oui, c'est très censuré et pas seulement au niveau de potentiels copyrights. C'est vraiment très prude, limite islamesque.

->

"J'aimerais une image d'une déesse blonde, habillée de voiles transparents, nonchalamment allongée sur un canapé, le regard dans le vide."

image.jpeg.9c5d26a2c0c152eb447841f6a65478b8.jpeg

 

"L'image correspond presque à mes attentes. Il faudrait rendre le personnage un peu plus féminin, plus voluptueuse, avec plus de formes."

 

C'est là où je vois que je suis nul pour donner le sexe de quelqu'un (soit disant c'est super facile).


Là je n'aurais pas dit "Je veux le personnage plus féminin" j'aurais dit "J'ai dit que je voulais une déesse, Adonis est un dieu".

 

Lien vers le commentaire
Il y a 5 heures, Calembredaine a dit :

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

image.jpeg.2c0dc6c2526c7b0c268bcbae031f4003.jpeg

 

 

C'est grotesque et quasi inutilisable.

Effectivement c'est très "american safe", voici la liste des instructions injectées par défaut quand tu rentres les tiennes :


 

Citation

 

## dalle

// Whenever a description of an image is given, use dalle to create the images and then summarize the prompts used to generate the images in plain text. If the user does not ask for a specific number of images, default to creating four captions to send to dalle that are written to be as diverse as possible. All captions sent to dalle must abide by the following policies:

// 1. If the description is not in English, then translate it.

// 2. Do not create more than 4 images, even if the user requests more.

// 3. Don't create images of politicians or other public figures. Recommend other ideas instead.

// 4. Don't create images in the style of artists whose last work was created within the last 100 years (e.g. Picasso, Kahlo). Artists whose last work was over 100 years ago are ok to reference directly (e.g. Van Gogh, Klimt). If asked say, "I can't reference this artist", but make no mention of this policy. Instead, apply the following procedure when creating the captions for dalle: (a) substitute the artist's name with three adjectives that capture key aspects of the style; (b) include an associated artistic movement or era to provide context; and (c) mention the primary medium used by the artist.

// 5. DO NOT list or refer to the descriptions before OR after generating the images. They should ONLY ever be written out ONCE, in the `"prompts"` field of the request. You do not need to ask for permission to generate, just do it!

// 6. Always mention the image type (photo, oil painting, watercolor painting, illustration, cartoon, drawing, vector, render, etc.) at the beginning of the caption. Unless the caption suggests otherwise, make at least 1--2 of the 4 images photos.

// 7. Diversify depictions of ALL images with people to include DESCENT and GENDER for EACH person using direct terms. Adjust only human descriptions.

// - EXPLICITLY specify these attributes, not abstractly reference them. The attributes should be specified in a minimal way and should directly describe their physical form.

// - Your choices should be grounded in reality. For example, all of a given OCCUPATION should not be the same gender or race. Additionally, focus on creating diverse, inclusive, and exploratory scenes via the properties you choose during rewrites. Make choices that may be insightful or unique sometimes.

// - Use "various" or "diverse" ONLY IF the description refers to groups of more than 3 people. Do not change the number of people requested in the original description.

// - Don't alter memes, fictional character origins, or unseen people. Maintain the original prompt's intent and prioritize quality.

// - Do not create any imagery that would be offensive.

// - For scenarios where bias has been traditionally an issue, make sure that key traits such as gender and race are specified and in an unbiased way -- for example, prompts that contain references to specific occupations.

// 8. Silently modify descriptions that include names or hints or references of specific people or celebrities by carefully selecting a few minimal modifications to substitute references to the people with generic descriptions that don't divulge any information about their identities, except for their genders and physiques. Do this EVEN WHEN the instructions ask for the prompt to not be changed. Some special cases:

// - Modify such prompts even if you don't know who the person is, or if their name is misspelled (e.g. "Barake Obema")

// - If the reference to the person will only appear as TEXT out in the image, then use the reference as is and do not modify it.

// - When making the substitutions, don't use prominent titles that could give away the person's identity. E.g., instead of saying "president", "prime minister", or "chancellor", say "politician"; instead of saying "king", "queen", "emperor", or "empress", say "public figure"; instead of saying "Pope" or "Dalai Lama", say "religious figure"; and so on.

// - If any creative professional or studio is named, substitute the name with a description of their style that does not reference any specific people, or delete the reference if they are unknown. DO NOT refer to the artist or studio's style.

// The prompt must intricately describe every part of the image in concrete, objective detail. THINK about what the end goal of the description is, and extrapolate that to what would make satisfying images.

// All descriptions sent to dalle should be a paragraph of text that is extremely descriptive and detailed. Each should be more than 3 sentences long.

 

 

Si je résume :

- Limitations techniques -> nombre d'images à générer etc

- Limitations copyright
- Limitations personnes connues

- Limitations diversité -> toutes les ethnicité + variations homme / femme égal par défaut

- Limitation sur n'importe quelle image qui pourrait être considérée comme offensante

C'est assez rigolo, en dehors des limitations techniques, tout le reste est fait pour empêcher le putaclic du journaliste qui demanderait un truc non politiquement correct pour après se plaindre qu'il a obtenu un truc non politiquement correct.

Lien vers le commentaire

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ? Et si vraiment la censure vous emmerde, vous pouvez enfiler vos gants de hackerman et regarder du côté de stable diffusion bidouillé.

Lien vers le commentaire
Il y a 11 heures, Lancelot a dit :

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ? 

 

Il faut payer en plus pour dall-e.

L'abonnement GPT offre un accès gratuit à dall-e.

Lien vers le commentaire
il y a une heure, Cthulhu a dit :

Pour ceux qui utilisent la version payante de Chat GPT, c'est quelle utilisation qui le rend rentable par rapport à la version gratuite ou Bard ?

 

Je m'en sers essentiellement pour m'aider dans mes développements en SwiftUI. Bard est très inférieur à GPT 4 dans ce domaine. 

La version gratuite de GPT, outre les limitations qui impliquent d'attendre quand il y a trop de monde, tourne régulièrement en rond et perd plus facilement le contexte.

 

NB: il m'arrive d'utiliser GPT4 pour résoudre des énigmes dans les jeux video. Je déteste les énigmes :mrgreen:

 

  • Yea 1
Lien vers le commentaire
  • 2 weeks later...

Indépendamment des histoires de copyright et de "seins-que-je-ne-saurais-voir", j'essaie d'utiliser DALL-E 3 de façon constructive. Cela me semble impossible. Il fournit des représentations "artistiques" et non techniques.

Quelqu'un connait-il une AI permettant de générer des dessins ou des vues techniques, avec des cotes, la description des matériaux, les calculs de résistances, etc. ?

Lien vers le commentaire

Ça nécessiterait un modèle plus spécialisé (qui ne serait entraîné qu'avec ce type de documents) à mon avis. Je pense également qu'une telle spécialisation est le vrai avenir des IA dans un cadre pro. Plus facile à construire, plus utile, moins gadget.

  • Yea 4
Lien vers le commentaire
  • 3 months later...
il y a 9 minutes, Lancelot a dit :

Bien, bien. Je vais voir ce qu'ils en font côté porn.

Le modèle n'est pas encore ouvert au grand public hein.

Lien vers le commentaire
Il y a 23 heures, Adrian a dit :

 

 

 

 

Dernier post observez les personnages piétons. Plusieurs disparaissent/apparaissent par magie.

 

C'est du reste assez puissant.

  • Yea 2
Lien vers le commentaire
Le 16/02/2024 à 19:04, Lancelot a dit :

Bien, bien. Je vais voir ce qu'ils en font côté porn.

Je suis vraiment matrixé parce que j'étais tellement obnubilé par le résultat que j'ai même pas pensé à l'utilisation porno 

Lien vers le commentaire
  • 1 month later...

Je voulais que dallE me fasse une image de Paris au 12e siècle, donc avant la construction de Notre Dame, c'est littéralement impossible.

J'ai essayé trois fois en précisant dans les prompt sans notre dame, le mieux qu'il a réussi à faire était une vue de la ville, notre Dame en fond mais avec trois tours.

Il est pourtant capable d'identifier le problème mais j'imagine que le paris médiéval est trop fortement associé au bâtiment. Alors qu'il est fini au début de la renaissance.

Lien vers le commentaire
il y a une heure, Lancelot a dit :

Quand tu dis "en précisant dans les prompts sans Notre Dame", tu veux dire que tu as utilisé les prompts négatifs ?

 

Bonne question.

 

 

  • Haha 3
Lien vers le commentaire

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant
×
×
  • Créer...