Aller au contenu

Lancelot

Utilisateur
  • Compteur de contenus

    23 331
  • Inscription

  • Dernière visite

  • Jours gagnés

    92

Tout ce qui a été posté par Lancelot

  1. Pas besoin de recompresser pour ça, c'est évident pour n'importe qui que c'est une version de la Joconde. Ça veut dire qu'une combinaison de paramètres dans le modèle permet d'isoler un facteur de "joconditude". Dans mes exemples précédents j'invoque cette joconditude sans autre modification, ce qui peut laisser penser à une simple récupération en mémoire, mais pour faire une telle chose on n'aurait pas besoin d'un modèle aussi sophistiqué. Le but n'est pas de combiner des images de la Joconde avec des images d'autres trucs mais de combiner la joconditude avec d'autres concepts, c'est ça qui est révolutionnaire. Si on commence à se soumettre aux volontés d'interdire au modèle de créer des images qui ressemblent trop à d'autres images, on va vite se retrouver dans la situation où il faudra quantifier cette ressemblance, délimiter les concepts définissant les images dont on ne veut pas s'approcher... bref on finira très vite avec uniquement la possibilité de construire des "images qui ne ressemblent à rien". Et à ce moment là autant tout jeter à la poubelle. Tout ça pour un risque qui n'existe pour ainsi dire pas tant que tu ne le fais pas exprès (et même dans ce cas, personne ne peut confondre les versions que j'ai généré avec la vraie Joconde). Je peux essayer de donner une autre illustration. D'un point de vue statistique c'est comme si tu mesurais disons la taille de 100 personnes, que tu en déduisais que la taille de cette population suit approximativement une distribution gaussienne avec telle moyenne et tel écart type, puis que tu tirais un nombre au hasard dans cette distribution. Et que tu me disais "ah ah mais on ne peut pas être 100% certains que la taille que je tire n'est pas exactement la taille d'une des 100 personnes !"
  2. Ah oui que ça soit une boîte noire c'est une feature en fait, pour le dire très grossièrement la période d'entraînement est le réseau qui se programme tout seul pour répondre à certains critères méta-programmés ("on veut ce type d'output dans telle condition"). Ceci dit des choses comme deep dream permettent d'entrevoir un tout petit peu ce qui se passe au niveau des couches cachées. Et ce n'est pas une version compressée du set d'entraînement. En ce qui concerne les fondements théoriques la genèse des réseaux de neurones est fondée sur la neuroscience (comme leur nom l'indique) et notamment la théorie sur comment la perception visuelle émerge de l'interaction entre aires cérébrales avec Hebb, McCulloch et Pitts, tout ça. Je suis d'accord, cependant je ne vois pas non plus pourquoi on s'empêcherait de le dire puisque c'est vrai avec une erreur potentielle à epsilon (disons qu'on ne peut pas garantir que ça ne va pas sortir exactement une image connue mais c'est la même probabilité que GPT-3 te sorte l'intégralité du texte de Hamlet parce que tu lui as demandé un texte dans le style de Shakespeare).
  3. Si vous avez quelques heures à perdre pour vous pencher sérieusement sur comment tout ça fonctionne, j'ai passé mon après midi à sélectionner ces quelques vidéos qui à mon avis constituent une très bonne introduction sur le fonctionnement précis du bidule. Ça part d'assez loin (dans le temps et dans les concepts), c'est extrêmement nerdy, mais c'est ce qu'il faut pour vraiment se faire une idée (ou au moins comprendre ce qu'on ne comprend pas).
  4. Alors pour les raisons que je donne dans le post que tu cites c'est sans doute une des manières les moins pertinentes de se représenter ce qui se passe Dans ce cas il faut dire aux artiste d'arrêter de se plaindre de l'outil.
  5. Est-ce qu'on ne toucherait pas du doigt quelque chose avec ces images watermarkées par des sites alors qu'elles ne leur appartiennent pas ? Peut-être ne sont-ils pas que des victimes innocentes ? 🤔 J'ai reproduit la prompt quelques fois et je ne suis jamais retombé sur une pseudo-watermark donc je ne pense pas que ça soit considéré par le modèle comme un trait caractéristique de "joconditude". Car c'est bien de ça qu'il s'agit, encore une fois le modèle ne va pas chercher un exemplaire de Joconde au pif à chaque fois dans la base de donnée d'entraînement pour le reproduire, la base de données d'entraînement n'est pas stockée dans le modèle. Ceci dit c'est intéressant de se demander si le modèle sait ce qu'est une watermark. Aha ! Donc on peut manipuler les conditions d'apparition de pseudo-watermarks. Seulement dans une certaine mesure par contre (là je montre un batch particulièrement fructueux) et dans ce cas précis (des variations comme "shuttershock landscape" ou "vincent van gogh starry night shutterstock", ou même "leonardo da vinci mona lisa shutterstock", ne marchent presque pas). Au passage je trouve celle-ci terrifiante : L'utilisation personne ne dit le contraire. L'illégalité est discutable et j'ai déjà donné mes arguments. Ben oui mon objectif ici c'est l'exploration de l'IA, pas une quelconque prétention artistique. Il se trouve que la Joconde est un des tableaux les plus connus du monde et donc sans doute une des images sur lesquelles elle est le plus entraînée.
  6. Je viens de voir un truc qui me permet d'illustrer ce point. Une de mes reproductions de la Jonconde contient une de ces pseudo-watermarks dont, pour le coup, on est complètement sûrs qu'elle n'était pas dans l'original : Donc pseudo watermark en sortie != copie d'une image avec watermark.
  7. Les images d'entraînement ne sont pas dans le modèle. Enfin j'imagine qu'elles pourraient l'être techniquement dans des cas très spécifiques d'overfitting, genre si tu entraînes le modèle sur juste une poignée d'images et que tu lui donnes suffisamment de paramètres pour représenter complètement ces images. Pour donner une idée des échelles, ce nombre serait le nombre d'images * le nombre de pixels * 255 * 255 * 255. Si on calcule pour une image de 600 par 400 pixels, ça donne à peu près 4000 milliards, disons un ou deux ordres de grandeur de moins si on considère que l'information est compressée. D'un autre côté le nombre de paramètres pour DALL-E ou Midjourney (avec leurs bases de données d'entraînement composées de millions d'images) est de l'ordre de grandeur de quelques dizaines de milliards grand max. Ceci étant le cas, retrouver exactement une image en sortie relève du hasard. Et je renvoie aux ordres de grandeur en jeu pour avoir une idée des probabilités. C'est une toute autre question, et effectivement un peut choisir des prompts qui génèrent des choses qui ressemblent à d'autre choses, c'est un peu le but initial du bazar, ça ne serait pas une technologie très intéressante si elle ne pouvait créer que des images qui ne ressemblent à rien. Pour réitérer mon avis, je pense qu'en cas de plagiat le responsable est la personne et pas l'outil. Une vidéo intéressante sur le sujet (les premières parties sont un peu confuses/méandreuses mais nécessaires pour son point final) :
  8. C'est quoi le problème avec jésuitique ?
  9. Wtf? L'image produite est nécessairement inédite dans le sens où l'assemblage particulier de pixels l'est. C'est pas une histoire de magie mais de bruit (tu donnes du bruit aléatoire unique en entrée, tu vas avoir quelque chose d'unique en sortie) et de paramètres du modèle (tu peux jouer avec pour te donner une idée si tu as e.g. une instance de stable diffusion). Elle peut bien sûr ressembler à une autre image connue comme illustré à mon post précédent ou même celui où j'essaie de faire du bruit aléatoire en output, mais ça ne sera jamais exactement la même image qu'un des samples utilisés pour l'entraînement.
  10. Ça montre que le modèle a intégré que tel type d'image se démarque souvent par la présence de tel truc, ici les watermarks qui peuvent évoquer telle ou telle bases de données. Ces bases de données ont donc été utilisées pour l'entraînement (ce que les développeurs ne nient pas), mais outre ça l'image générée n'a aucune raison d'être la reproduction d'une image spécifique d'une base de donnée spécifique. Toujours est-il que oui, comme je le disais plus haut, je pense qu'à l'avenir les images d'entraînement seront plus maîtrisées (pas que pour des raisons de copyright d'ailleurs). Là on est dans un cas plus intéressant : si je demande ouvertement à l'IA de faire du plagiat, est-ce que ça marche ? Plus ou moins bien. Le plus : Le moins : De mon point de vue le responsable du résultat dans ce cas est celui qui a écrit la prompt, et c'est lui qui devrait être emmerdé au cas où il essaierait de gagner de l'argent en se faisant passer pour Van Gogh ou De Vinci. Ici l'IA n'est qu'un outil, techniquement je peux aussi plagier une image en utilisant Paint.
  11. Elle semble alarmée pour des raisons farfelues donc je ne suis pas optimiste.
  12. Well encore une fois ça dépend de ce qu'on met dans le terme "utilisation". Il n'y a pas de copie des images dans le modèle (là on pourrait discuter sur la reproduction qui est effectivement un cas prévu par le copyright). Techniquement, le modèle ne fait que "consulter" des images librement accessibles et être influencé par elles, tout comme pourrait l'être un cerveau humain de manière absolument légitime. Mais il le fait systématiquement et automatiquement, et la question se pose de savoir si ça en fait un processus de nature différente. Je pense que l'avenir tranchera de toute manière en faveur d'une multitude de modèles dont chacun sera entraîné sur une base de donnée sélectionnée et contrôlée dans un but précis, suivant l'exemple d'un waifu diffusion :
  13. Avicsshsesivrglincsbioir, mon artiste préféré Bon oui ça montre que les watermarks sont un élément suffisamment saillant dans la base de données d'entraînement pour que leur existence soit reflétée dans le modèle. Ce qui peut être un problème ou pas selon la perspective (est-ce qu'un copyright peut empêcher de regarder une œuvre ou de s'en inspirer ?).
  14. Un de mes seuls souvenirs de "pré-lecture" est avec un bouquin de cette collection (ils ne semblent pas avoir d'édition récente ce qui est triste) :
  15. Je pense que ça sera une comédie sur les tribulations de la première femme chez les space marines qui devra combattre les préjugés d'une société rétrograde et patriarcale. Au cours de son voyage elle trouvera l'amour avec une autre femme (peut-être une eldar si on a le budget pour les effets spéciaux) puis découvrira qu'elle est la clé pour sauver et réformer l'Imperium.
  16. Ils sont cons aussi, on a vu qu'avec le covid ils avaient la parfaite fenêtre d'opportunité pour enfoncer tout ça.
  17. Oui honte sur moi pour avoir vu un Disney en pleine renaissance un an après le fucking Roi Lion
  18. Jamais vu Avatar. J'ai vu Pocahontas de Disney et je me suis laissé dire que c'était suffisant.
  19. J'imaginais une blague avec Salma, j'ai eu très peur.
  20. Sans avoir encore pris le temps de mettre le nez dans les supposées méthodes de quantification du biais, je suppute que c'est plus compliqué que ça. Par exemple typiquement dans un article on ne rapporte pas qu'un seul résultat ou même une seule expérience. C'est tout à fait courant d'avoir une histoire du genre "on a testé ça, puis ça ne marchait pas super alors on a modifié tel truc et après ça marche, on discute de pourquoi". Dans ce cas (lui-même caricatural mais moins) on a bien deux résultats rapportés, un non-significatif et un significatif. Et il n'y a pas de biais.
  21. En effet, ça me dépasse qu'on puisse écrire ça et être publié. Ce point en particulier n'est pas repris dans la discussion mais elle vaut tout de même la peine d'être lue, dites-moi si vous suivez bien la petite musique de fond. Donc ne pas être vacciné augmente le risque d'accident et les accidents représentent des risques pour les autres. Vous savez quoi d'autre contribue aux accidents ? Des facteurs psychologiques comme le tempérament. Quel type de tempérament dangereux pourrait contribuer à la fois au scepticisme pour le vaccin et à l'augmentation des risques d'accident ? Le "manque de confiance dans le gouvernement" ? La "croyance dans la liberté" ? Une "antipathie pour la régulation" ? Être "exposé à de mauvaise information" ? Une "identité politique" ? Des "résaux sociaux incitant à la méfiance envers les recommandations de santé publique" ? 🤔 Ensuite deux paragraphes de limitations plus honnêtes, puis... Intéressant qu'ils éprouvent le besoin de préciser ça dans une étude sur les facteurs psychologiques. Surtout que logiquement tout ce qu'ils écrivent par ailleurs tend à relativiser cet effet. Personellement j'utiliserais ça comme un contrôle et je soustrairais simplement l'effet "accident de la route" à l'effet "pneumonie" pour avoir une meilleure approximation du vrai impact du vaccin sur le covid, au delà de la psychologie justement. Et voilà l'apothéose. Donc : - les médecins devraient faire plus de sécurité routière - les services de secours intervenant sur les accidents devraient prendre des précautions parce qu'ils risquent d'être confrontés à d'impurs non vaccinés - les assurances devraient prendre la vaccination en compte (ce point laisse rêveur) - les non vaccinés sont dangereux partout, même à l'extérieur
  22. Au cours de mes années de confs je n'ai vu qu'un seul cas de personne draguant sa proie de manière outrancière et gênante. C'était une femme. Sympathique au demeurant (enfin le fait que je n'étais pas la proie en question compte sans doute) mais qui avait des idées bien arrêtées sur son homme idéal envers et contre tout.
  23. Ça dépend de ce que tu appelles "les femmes".
  24. Lancelot

    La réforme des retraites

    @Bézoukhov a raison dans le sens où les gens (normalement constitués) ne pensent pas en termes de "ma génération vs les boomers" mais en termes de "ma famille, parents inclus, vs le reste du monde".
×
×
  • Créer...