Aller au contenu

Qwen, le LLM de Alibaba


Messages recommandés

  • 1 month later...
Posté

https://qwenlm.github.io/blog/qwq-32b

 

Citation

We are excited to introduce QwQ-32B, a model with 32 billion parameters that achieves performance comparable to DeepSeek-R1, which boasts 671 billion parameters (with 37 billion activated). This remarkable outcome underscores the effectiveness of RL

 

Les LLMs open source chinois sont lancés dans une course à l'efficacité.

  • Yea 2
Posté

Je l'utilise depuis quelques semaines déjà, et il est particulièrement performant pour résumer les textes.

Je recommande.

  • Yea 1
  • 6 months later...
Posté

Un truc marrant que je viens de remarquer avec le nouveau Qwen.

 

Un de mes prompts de test est "Hello I am a". Ce qui donne généralement une réponse bateau "je suis un étudiant à telle université et mes hobbies sont bla bla bla"

 

La réponse de Qwen : "je suis une femme trans, je prends des hormones depuis un an et mon cycle menstruel est bizarre" :D

 

Au doigt mouillé, je pense qu'ils sur-indexent certains subreddits par rapport aux modèles occidentaux. Les anciennes versions de GPT faisaient ça aussi ce qui donnait des résultats marrants parfois

 

 

  • Haha 1

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant
×
×
  • Créer...