Aller au contenu

DALL-E et autres modèles générateurs d'images et de vidéos


Messages recommandés

Posté

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

image.jpeg.2c0dc6c2526c7b0c268bcbae031f4003.jpeg

 

 

C'est grotesque et quasi inutilisable.

  • Haha 2
Posté

Il refuse aussi de générer des images tirées de personnes nommées (y compris avec un style non realiste), alors que Midjourney le fait (a part quelques exeptions).

Ah et pour une raison que j'ignore, si tu lui demande de générer une image de Moscou il refuse alors que ville russe, Pekin ou Paris il accepte. Je ne comprend pas sa logique.

 

Et oui tout ce qui peut étre lié de près ou de loin à la sexualité il refuse. Je pense que ce bridage est poussé à l'extreme car c'était le grand jeu au début de contourner les restrictions chatgpt.

Je pense que Chatgpt est victime de son succès, il est tellement utilisé et médiatique qu'ils ont peur d'un bad buzz à la moindre image/réponse pourrait potentiellement faire polémique.

Posté
3 hours ago, Calembredaine said:

 

Ha oui, c'est très censuré et pas seulement au niveau de potentiels copyrights. C'est vraiment très prude, limite islamesque.

->

"J'aimerais une image d'une déesse blonde, habillée de voiles transparents, nonchalamment allongée sur un canapé, le regard dans le vide."

image.jpeg.9c5d26a2c0c152eb447841f6a65478b8.jpeg

 

"L'image correspond presque à mes attentes. Il faudrait rendre le personnage un peu plus féminin, plus voluptueuse, avec plus de formes."

 

C'est là où je vois que je suis nul pour donner le sexe de quelqu'un (soit disant c'est super facile).


Là je n'aurais pas dit "Je veux le personnage plus féminin" j'aurais dit "J'ai dit que je voulais une déesse, Adonis est un dieu".

 

Posté
Il y a 5 heures, Calembredaine a dit :

Haha, il refuse de reproduire "L'origine du monde", prétextant tout d'abord des "droits d'auteur" puis quand je lui dit que l'oeuvre date de 1866, il tergiverse en évoquant "une nature sensible".

J'insiste et voilà le résultat:

image.jpeg.2c0dc6c2526c7b0c268bcbae031f4003.jpeg

 

 

C'est grotesque et quasi inutilisable.

Effectivement c'est très "american safe", voici la liste des instructions injectées par défaut quand tu rentres les tiennes :


 

Citation

 

## dalle

// Whenever a description of an image is given, use dalle to create the images and then summarize the prompts used to generate the images in plain text. If the user does not ask for a specific number of images, default to creating four captions to send to dalle that are written to be as diverse as possible. All captions sent to dalle must abide by the following policies:

// 1. If the description is not in English, then translate it.

// 2. Do not create more than 4 images, even if the user requests more.

// 3. Don't create images of politicians or other public figures. Recommend other ideas instead.

// 4. Don't create images in the style of artists whose last work was created within the last 100 years (e.g. Picasso, Kahlo). Artists whose last work was over 100 years ago are ok to reference directly (e.g. Van Gogh, Klimt). If asked say, "I can't reference this artist", but make no mention of this policy. Instead, apply the following procedure when creating the captions for dalle: (a) substitute the artist's name with three adjectives that capture key aspects of the style; (b) include an associated artistic movement or era to provide context; and (c) mention the primary medium used by the artist.

// 5. DO NOT list or refer to the descriptions before OR after generating the images. They should ONLY ever be written out ONCE, in the `"prompts"` field of the request. You do not need to ask for permission to generate, just do it!

// 6. Always mention the image type (photo, oil painting, watercolor painting, illustration, cartoon, drawing, vector, render, etc.) at the beginning of the caption. Unless the caption suggests otherwise, make at least 1--2 of the 4 images photos.

// 7. Diversify depictions of ALL images with people to include DESCENT and GENDER for EACH person using direct terms. Adjust only human descriptions.

// - EXPLICITLY specify these attributes, not abstractly reference them. The attributes should be specified in a minimal way and should directly describe their physical form.

// - Your choices should be grounded in reality. For example, all of a given OCCUPATION should not be the same gender or race. Additionally, focus on creating diverse, inclusive, and exploratory scenes via the properties you choose during rewrites. Make choices that may be insightful or unique sometimes.

// - Use "various" or "diverse" ONLY IF the description refers to groups of more than 3 people. Do not change the number of people requested in the original description.

// - Don't alter memes, fictional character origins, or unseen people. Maintain the original prompt's intent and prioritize quality.

// - Do not create any imagery that would be offensive.

// - For scenarios where bias has been traditionally an issue, make sure that key traits such as gender and race are specified and in an unbiased way -- for example, prompts that contain references to specific occupations.

// 8. Silently modify descriptions that include names or hints or references of specific people or celebrities by carefully selecting a few minimal modifications to substitute references to the people with generic descriptions that don't divulge any information about their identities, except for their genders and physiques. Do this EVEN WHEN the instructions ask for the prompt to not be changed. Some special cases:

// - Modify such prompts even if you don't know who the person is, or if their name is misspelled (e.g. "Barake Obema")

// - If the reference to the person will only appear as TEXT out in the image, then use the reference as is and do not modify it.

// - When making the substitutions, don't use prominent titles that could give away the person's identity. E.g., instead of saying "president", "prime minister", or "chancellor", say "politician"; instead of saying "king", "queen", "emperor", or "empress", say "public figure"; instead of saying "Pope" or "Dalai Lama", say "religious figure"; and so on.

// - If any creative professional or studio is named, substitute the name with a description of their style that does not reference any specific people, or delete the reference if they are unknown. DO NOT refer to the artist or studio's style.

// The prompt must intricately describe every part of the image in concrete, objective detail. THINK about what the end goal of the description is, and extrapolate that to what would make satisfying images.

// All descriptions sent to dalle should be a paragraph of text that is extremely descriptive and detailed. Each should be more than 3 sentences long.

 

 

Si je résume :

- Limitations techniques -> nombre d'images à générer etc

- Limitations copyright
- Limitations personnes connues

- Limitations diversité -> toutes les ethnicité + variations homme / femme égal par défaut

- Limitation sur n'importe quelle image qui pourrait être considérée comme offensante

C'est assez rigolo, en dehors des limitations techniques, tout le reste est fait pour empêcher le putaclic du journaliste qui demanderait un truc non politiquement correct pour après se plaindre qu'il a obtenu un truc non politiquement correct.

Posté

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ? Et si vraiment la censure vous emmerde, vous pouvez enfiler vos gants de hackerman et regarder du côté de stable diffusion bidouillé.

Posté
Il y a 11 heures, Lancelot a dit :

Je ne comprends pas l'intérêt de la tuyauterie chatGPT > dall-e. Vous ne pouvez pas juste faire un prompt dall-e vous mêmes comme des grandes personnes ? 

 

Il faut payer en plus pour dall-e.

L'abonnement GPT offre un accès gratuit à dall-e.

Posté

Pour ceux qui utilisent la version payante de Chat GPT, c'est quelle utilisation qui le rend rentable par rapport à la version gratuite ou Bard ?

Posté
il y a une heure, Cthulhu a dit :

Pour ceux qui utilisent la version payante de Chat GPT, c'est quelle utilisation qui le rend rentable par rapport à la version gratuite ou Bard ?

 

Je m'en sers essentiellement pour m'aider dans mes développements en SwiftUI. Bard est très inférieur à GPT 4 dans ce domaine. 

La version gratuite de GPT, outre les limitations qui impliquent d'attendre quand il y a trop de monde, tourne régulièrement en rond et perd plus facilement le contexte.

 

NB: il m'arrive d'utiliser GPT4 pour résoudre des énigmes dans les jeux video. Je déteste les énigmes :mrgreen:

 

  • Yea 1
  • 2 weeks later...
Posté

Indépendamment des histoires de copyright et de "seins-que-je-ne-saurais-voir", j'essaie d'utiliser DALL-E 3 de façon constructive. Cela me semble impossible. Il fournit des représentations "artistiques" et non techniques.

Quelqu'un connait-il une AI permettant de générer des dessins ou des vues techniques, avec des cotes, la description des matériaux, les calculs de résistances, etc. ?

Posté

Ça nécessiterait un modèle plus spécialisé (qui ne serait entraîné qu'avec ce type de documents) à mon avis. Je pense également qu'une telle spécialisation est le vrai avenir des IA dans un cadre pro. Plus facile à construire, plus utile, moins gadget.

  • Yea 4
  • 3 months later...
Posté
il y a 9 minutes, Lancelot a dit :

Bien, bien. Je vais voir ce qu'ils en font côté porn.

Le modèle n'est pas encore ouvert au grand public hein.

Posté
Il y a 23 heures, Adrian a dit :

 

 

 

 

Dernier post observez les personnages piétons. Plusieurs disparaissent/apparaissent par magie.

 

C'est du reste assez puissant.

  • Yea 2
Posté
Le 16/02/2024 à 19:04, Lancelot a dit :

Bien, bien. Je vais voir ce qu'ils en font côté porn.

Je suis vraiment matrixé parce que j'étais tellement obnubilé par le résultat que j'ai même pas pensé à l'utilisation porno 

  • 1 month later...
Posté

Je voulais que dallE me fasse une image de Paris au 12e siècle, donc avant la construction de Notre Dame, c'est littéralement impossible.

J'ai essayé trois fois en précisant dans les prompt sans notre dame, le mieux qu'il a réussi à faire était une vue de la ville, notre Dame en fond mais avec trois tours.

Il est pourtant capable d'identifier le problème mais j'imagine que le paris médiéval est trop fortement associé au bâtiment. Alors qu'il est fini au début de la renaissance.

Posté

Quand tu dis "en précisant dans les prompts sans Notre Dame", tu veux dire que tu as utilisé les prompts négatifs ?

Posté
il y a une heure, Lancelot a dit :

Quand tu dis "en précisant dans les prompts sans Notre Dame", tu veux dire que tu as utilisé les prompts négatifs ?

 

Bonne question.

 

 

  • Haha 3
  • 1 month later...
Posté

Je me faisais une remarque hier. Il y a un an, j'étais persuadé que l'on verrait sortir assez rapidement des films entièrement générés par IA pour la partie technique (en gros, le scénario est bon et on casse les coûts en produisant tout ou presque avec de l'IA) (au hasard, une adaptation des romans Star Wars :D ).

 

Et je suis étonné de ne pas en voir. Soit que personne ne s'y mette (mais il y a trop de nerds sur cette planète). Soit que ça coûte encore trop cher. Soit que l'IA n'est pas capable de le faire.

Vu les films de merde qui sortent depuis 10 ans, il y a un marché ; donc je capte pas pourquoi.

Posté

Pour l'instant, de ce que j'ai vu, l'IA n'est pas au top pour les vidéos. J'ai l'impression qu'elle a encore du mal à comprendre la différence entre le fond et la forme, et la permanence des objets. Donc je parie sur : l'IA n'est pas *encore* capable de le faire.

Posté

À son niveau actuel, l'IA est capable de générer quelque chose comme un clip de musique un peu psychédélique. La permanence des objets et la mémoire du contexte sont des énormes obstacles (mon lien d'hier montre ce que donnent les efforts pour les surmonter).

Posté
il y a 57 minutes, Bézoukhov a dit :

Je me faisais une remarque hier. Il y a un an, j'étais persuadé que l'on verrait sortir assez rapidement des films entièrement générés par IA pour la partie technique (en gros, le scénario est bon et on casse les coûts en produisant tout ou presque avec de l'IA) (au hasard, une adaptation des romans Star Wars :D ).

 

Et je suis étonné de ne pas en voir. Soit que personne ne s'y mette (mais il y a trop de nerds sur cette planète). Soit que ça coûte encore trop cher. Soit que l'IA n'est pas capable de le faire.

Vu les films de merde qui sortent depuis 10 ans, il y a un marché ; donc je capte pas pourquoi.


La CGI ça coûte une fortune quand même.

Posté
1 hour ago, Bézoukhov said:

Je me faisais une remarque hier. Il y a un an, j'étais persuadé que l'on verrait sortir assez rapidement des films entièrement générés par IA pour la partie technique (en gros, le scénario est bon et on casse les coûts en produisant tout ou presque avec de l'IA) (au hasard, une adaptation des romans Star Wars :D ).

 

Et je suis étonné de ne pas en voir. Soit que personne ne s'y mette (mais il y a trop de nerds sur cette planète). Soit que ça coûte encore trop cher. Soit que l'IA n'est pas capable de le faire.

Vu les films de merde qui sortent depuis 10 ans, il y a un marché ; donc je capte pas pourquoi.

Pour l'instant on ne sait pas garder une cohérence assez longtemps. Ça viendra. 

Posté
Il y a 1 heure, Lancelot a dit :

À son niveau actuel, l'IA est capable de générer quelque chose comme un clip de musique un peu psychédélique. La permanence des objets et la mémoire du contexte sont des énormes obstacles (mon lien d'hier montre ce que donnent les efforts pour les surmonter).

Ces difficultés pourraient être un indice assez fort en faveur de la thèse de la cognition incarnée, non ?

Posté
12 hours ago, Bézoukhov said:

Je me faisais une remarque hier. Il y a un an, j'étais persuadé que l'on verrait sortir assez rapidement des films entièrement générés par IA pour la partie technique (en gros, le scénario est bon et on casse les coûts en produisant tout ou presque avec de l'IA) (au hasard, une adaptation des romans Star Wars :D ).

Oui enfin techniquement cela s'appellerait un dessin animé  film d'animation.

 

 

 

 

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant
×
×
  • Créer...