Aller au contenu

Azref

Utilisateur
  • Compteur de contenus

    2 067
  • Inscription

  • Jours gagnés

    6

Messages postés par Azref

  1. il y a 24 minutes, Prouic a dit :

    Je sais pas si comme moi vous avez tenté plusieurs conversations libérales dans votre environnement moyen. Au vu de ma fan base, qui doit atteindre un bon 5% de mes tentatives, je pense pas qu'à cette heure-ci il y ait 30% de votants premier tour sur cette ligne éditoriale :D

    Des fois ça marche, tant que tu donnes le raisonnement et que tu ne prononces jamais le mot "libéral" ("Libéral? Non j'aime pas Macron!").

     

  2. à l’instant, Sloonz a dit :

     

    Je crois que tu voulais écrire "sans RLHF". Mais non, ces modèles sont avec RLHF. Tu peux accéder à ces modèles sur https://platform.openai.com/playground, et tu verras que les résultats sont très similaires (si non exactement les mêmes) qu’avec https://chat.openai.com/

    Non je voulais bien dire "avec" 😀.

    On est d'accord du coup.

     

    Citation

     

    La dernière fois que j’avais réussi à faire cracher à l’interface dédiée ses instructions, il n’y avait pas d’instruction spéciales (c’était avant l’intégration avec DALL-E) :

     

    You are ChatGPT, a large language model trained by OpenAI, based on the GPT-4 architecture.
    Knowledge cutoff: 2022-01
    Current date: 2023-09-29

     

    (le current date était correct, ce qui est une forte indication que j’avais réussi à sortir le prompt système sans hallucination).

     

    Intéressant, du coup un chatgpt sans moderation endpoint est possible en api avec le même ordre en utilisant le dernier snapshot de gpt4.

  3. Il y a 4 heures, Sloonz a dit :

    Non. À ma connaissance le seul modèle de base d’OpenAI encore accessible est code-davinci-002 (qui, comme son nom l'indique, a très largement été entrainé sur  du code).

    Non, tu peux accéder à gpt 3.5 "turbo", gpt 4 et même le dernier gpt 4 "turbo" en API.

    https://openai.com/pricing

    Et pour moi tous ces modèles sont RHLF.

     

    Ou alors tu peux utiliser directement chatgpt par l'interface dédiée, qui est le modèle gpt 3.5/4 + le "moderation endpoint" activé par défaut + probablement des instructions pour l'orienter en tant que chatbot "safe" de base (+exemples de conversation?).

     

    Tel que je le comprends, lorsque tu dis "pouce vert/rouge" dans chatgpt tu aide à la construction de la prochaine itération/fine tune de gpt4, et probablement dans la conversation/historique en cours laisser ou non l'entrée dans le contexte donné au modèle.

     

    Citation

    Il y a une problématique légale/économique/woke à ça. Si tu commences ton prompt par "Sieg Heil", la suite du texte généré par ton LLM pur a de fortes chances d’être… problématique. Tandis que tu peux entraîner un modèle RLHF à se tenir très très loin de ça. Aucune entreprise/laboratoire ne veut prendre la responsabilité de permettre le premier usage.

    Certes, mais bon les titres de journaux à base de "l'IA est raciste/sexiste/woke/antiwoke" étaient un peu inévitables de toute manière.

  4. il y a une heure, Sloonz a dit :

     

    GPT, c’est exactement ce que les gens s’imaginent en pointant "LLM predicting next token". ChatGPT, le produit avec lequel tout le monde interagit, ce  n’est pas GPT, c’est GPT + RLHF

    Je ne suis pas expert sur le sujet du tout donc à prendre avec des pincettes, mais pour moi gpt4 (et 3.5) est le modèle de base qui utilise RHLF.
    Chatgpt, c'est juste la surcouche "chatbot" (+ le site web pour l'utiliser), avec des instructions/limites en amont données pour qu'il se comporte en chatbot. Tu peux arriver à un chatgpt "maison" en api simplement en ajoutant des instructions à chaque requête vers gpt3.5/4.

     

    Et je t'avoue que je n'ai pas non plus compris le tweet : RHLF ou non, le modèle prédit toujours le token le plus probable, non?

    C'est juste que l’entraînement a été "amélioré"/fine tuné par des humains en amont, du coup le token suivant sera plus "juste".

  5. Il y a 11 heures, Tramp a dit :

    Nestle vole l’eau c’est un truc répandu chez les gauchistes. 

    Mais pourquoi Nestlé en particulier?

    "Volvic vole l'eau" ça pourrait marcher aussi non?

     

    Il y a 10 heures, NoName a dit :

    objectivement ils ont l'air d'avoir fait des trucs assez dégueulasse, après comme les gauchistes mettent dans le même panier "savoir gérer une boite correctement" et "mettre des bébés dans dss fours" c'est toujours dur de se faire un avis

    C'est bien mon soucis, en lisant les commentaires Nestlé est une caricature de méchant de film.

     

    Il y a 3 heures, Marlenus a dit :

    Dans ma bulle c'est plutôt Coca qui est visé par ça (avec l'exemple du mexique).

    Tiens, en dehors des rumeurs sur le Coca qui "enlève la rouille", jamais entendu ça sur la boite.

  6. A chaque fois que je lis des news, voit des vidéos, ou simplement discute de Nestlé, j'ai toujours un commentaire, une réaction sur le fait que c'est une entreprise horrible etc.
    Même Coca, Macdo ou Facebook n'ont pas ce genre de réaction épidermique, c'est complètement fou.
    Ca vient d'un truc vrai, ou bien la réputation catastrophique assez partagée de l'entreprise est un coup de concurrents...?

  7. Il y a 20 heures, Sloonz a dit :

    Un dévendeur c'est la nouvelle lubie écologique où, quand tu vas chez un commerçant, il est censer t’expliquer pourquoi tu n’as en fait pas besoin de ce dont tu étais venu acheter.

     

    Il y a 13 heures, Marlenus a dit :

     

     

    Tu en as d'autres sur le même thème.

    C'est financé par les impôts français.

     

    Merci pour l'explication, mais c'est incroyable ce truc.
    Ca passe à la tv je suppose?

    En tout cas je suis heureux d'apprendre qu'on dépense 4 milliards d'euro (budget ademe) pour faire de la propagande décroissante.

×
×
  • Créer...