Pas du tout , pas eu trop le temps ces derniers tempsVous avez testé le navigateur boosté à l'IA, Atlas ou Comet ?
Cela permet de faire de nouvelles choses intéressantes.
Follow along with the video below to see how to install our site as a web app on your home screen.
Note: this_feature_currently_requires_accessing_site_using_safari
Pas du tout , pas eu trop le temps ces derniers tempsVous avez testé le navigateur boosté à l'IA, Atlas ou Comet ?
Cela permet de faire de nouvelles choses intéressantes.
Un Noël très IA cette année !Annonce importante :
Google s'apprête à sortir Gémini 3.0 avant la fin de l'année
OpenAI s'apprête à sortir ChatGPT 5.1 avant la fin de l'année
ça n'a pas été dit officiellement, mais il y a eu des leaks sur twitter.
D'ailleurs j'en profite pour ajouter qu'Elon Musk a déjà twitté il y a quelques temps que Grok 5 sortirait avant la fin de l'année également.
A voir ce que ça donne !
Plus le score est haut, plus le modèle a une forme de “raisonnement pur”.
Score bas = mieux (distance d’erreur plus faible).
Score = ELO, comme une note de niveau.
Très proche du travail d’un ingénieur logiciel.
Score = net worth (comme dans un jeu ou une simulation).
Très important pour l’analyse de documents, livres, longs PDFs, etc.Merci pour le partage, intéressant à lire et comprendre.j'ai demandé à chatgpt de me dire ce que ça représentait :
1. Humanity’s Last Exam
Test : Raisonnement académique très avancé (niveau difficile).
Signifie en vrai :
Mesure la capacité du modèle à raisonner logiquement comme dans des examens universitaires complexes.
- Avec outils / sans outils : certains modèles peuvent utiliser un moteur de recherche ou un code interpreter.
2. ARC-AGI-2
Test : Puzzles visuels/logiques (intelligence générale artificielle).
Signifie en vrai :
Évalue la capacité du modèle à comprendre des motifs et à résoudre des problèmes abstraits sans langage.
Plus le score est haut, plus le modèle a une forme de “raisonnement pur”.
3. GPQA Diamond
Test : Connaissances scientifiques de haut niveau (physique, bio, chimie).
Signifie en vrai :
Montre si le modèle répond comme un expert scientifique (niveau PhD).
4. AIME 2025
Test : Problèmes mathématiques de concours avancés.
Signifie en vrai :
Montre la qualité du raisonnement mathématique complexe.
- Avec code : capacité à combiner maths + programmation.
5. MathArena Apex
Test : Très gros problèmes mathématiques difficiles.
Signifie en vrai :
Montre comment le modèle gère des maths très créatives, avec plusieurs étapes.
6. MMMU-Pro
Test : Raisonnement multimodal (texte + images).
Signifie en vrai :
Exemples : comprendre un schéma, interpréter une image scientifique, etc.
7. ScreenSpot-Pro
Test : Compréhension d’écran (interface, menus).
Signifie en vrai :
Le modèle doit reconnaître des éléments sur une capture d’écran.
Utile pour l’automatisation, assistants PC, etc.
8. CharXiv Reasoning
Test : Raisonner à partir de graphiques, tableaux, flux.
Signifie en vrai :
Mesure la capacité à analyser des rapports, des data visualisations.
9. OmniDocBench 1.5
Test : OCR + compréhension de documents.
Signifie en vrai :
Reconnaître du texte dans des documents scannés, PDF, tableaux.
Score bas = mieux (distance d’erreur plus faible).
10. Video-MMMU
Test : Compréhension de vidéos.
Signifie en vrai :
Le modèle doit comprendre ce qu’il se passe dans une vidéo (actions, relations, objets).
11. LiveCodeBench Pro
Test : Problèmes de programmation compétitive.
Signifie en vrai :
Montre la capacité à résoudre des problèmes algorithmiques comme dans les concours Codeforces.
Score = ELO, comme une note de niveau.
12. Terminal-Bench 2.0
Test : Utilisation d’un terminal/agent.
Signifie en vrai :
Évalue si le modèle peut contrôler un environnement comme un terminal pour résoudre une tâche.
13. SWE-Bench Verified
Test : Correction de bugs réels dans du code.
Signifie en vrai :
Le modèle reçoit un bug GitHub et doit proposer un vrai fix.
Très proche du travail d’un ingénieur logiciel.
14. t2-bench
Test : Utilisation d’outils et d’agents.
Signifie en vrai :
Tester comment un modèle utilise un environnement réel (API, outils) pour accomplir une tâche.
15. Vending-Bench 2
Test : Agentic tasks longues (plusieurs actions à enchaîner).
Signifie en vrai :
Ex : naviguer dans des menus, trouver un objet, suivre une procédure.
Score = net worth (comme dans un jeu ou une simulation).
16. FACTS Benchmark Suite
Test : Vérification factuelle, recherche d'informations.
Signifie en vrai :
Mesure si le modèle donne des réponses correctes, factuelles et fiables.
17. SimpleQA Verified
Test : Questions simples mais vérifiées strictement.
Signifie en vrai :
Précision sur des faits basiques.
Montre si le modèle hallucine ou non.
18. MMLU
Test : Test général sur 57 domaines (histoire, médecine, droit…).
Signifie en vrai :
Benchmark standard utilisé pour mesurer l'intelligence générale “classique” d’un LLM.
19. Global PIQA
Test : Raisonnement du sens commun dans différentes cultures.
Signifie en vrai :
Test si le modèle peut raisonner comme un humain avec du sens commun.
20. MRCR v2 (8-needle)
Test : Long context performance (128k et 1M tokens).
Signifie en vrai :
Évalue si le modèle peut retrouver une information précise dans un contexte extrêmement long.
Très important pour l’analyse de documents, livres, longs PDFs, etc.
ça me fait chier de le dire , mais je pense arreter mon abonnement chez GPT pour aller chez Gémini ^^'Merci pour le partage, intéressant à lire et comprendre.
Y'à plus qu'à tester maintenant !
J'ai déjà entendu parler d'un abonnement à 20e par mois qui regroupait toutes les IA effectivementIl y a une application qui regroupe les ia
Génie je crois. Quelqu'un voit?
Je me suis dit la même chose. Quand je vois les reviews qui disent que Gemini 3 surpasse GPT....ça me fait chier de le dire , mais je pense arreter mon abonnement chez GPT pour aller chez Gémini ^^'
C'est déjà le prix mensuel de GPT Pro, je serais étonnéJ'ai déjà entendu parler d'un abonnement à 20e par mois qui regroupait toutes les IA effectivement
C'est déjà le prix mensuel de GPT Pro, je serais étonné
Y'a pas ChatGPT là dedans. A voir si c'est utile![]()
Stay at the top of AI
The best GenAI models in one subscription. Access GPT, Claude, Gemini, Mistral, Llama, Nano Banana, GPT-image, FLUX, and stay up to date with AI.mammouth.ai
c'est 10e par mois en fait x)
C'est pour ça que je n'ai pas envie de testé ^^ , car je ne sais pas trop ce que c'est. Je préfère payer la version originale de l'IA que je veux utiliser.Je pense que c'est un site qui regroupe toutes les IA en un seul endroit. Pratique, mais il n'est pas sûr qu'on ait accès aux versions payantes des IA (je dirais même qu'on n'y a pas accès)
Payer 10€ HT par mois pour avoir accès aux IA gratuites, c'est cher payés. Tout ça parce que tout est regroupé au même endroit.
Abusé ?
Concernant l'immortalité; y'a d'autres problèmes à résoudre alors.C'est pour ça que je n'ai pas envie de testé ^^ , car je ne sais pas trop ce que c'est. Je préfère payer la version originale de l'IA que je veux utiliser.
Tout le monde parle de "plateau" concernant l'IA , mais à chaque fois une nouvelle IA sort et écrase les IA précédentes. C'est bien partis pour que l'IA révolutionne notre vie , comme l'électricité l'a fait. Même au delà , qui sait , si l'IA tient vraiment ses promesses, on sera peut être la première génération à connaître l'immortalité
Nan il n'y aura plus de retraite, les IA travailleront pour nous ! Ouais je sais , c'est un monde utopique , mais faut bien rêver un peu !Concernant l'immortalité; y'a d'autres problèmes à résoudre alors.
Et la France ne devra plus se plaindre si on augmente l'age de la retraite à 4000 ans lol
Tout à fait en accord avec toi.Nan il n'y aura plus de retraite, les IA travailleront pour nous ! Ouais je sais , c'est un monde utopique , mais faut bien rêver un peu !
Et tout ce qui nous sembler Impossible avant ne l'est plus maintenant.
Dans les années 1900 les scientifiques étaient unanimes , il faudrait plusieurs millions d'années encore avant de penser à voler. Pourtant 4 ans plus tard les frères Wright étaient dans les airs.
Faut croire en l'impossible ! Tout notre univers repose sur des lois mathématiques
Si l'IA tient ses promesses, elle pourrait théoriquement résoudre toutes les maladies, et le vieillissement est une sorte de maladie.
De plus, si on arrive au stade d'AGI puis d'ASI, il y a de fortes chances qu'au bout d'un moment on ait une "fusion homme machine" via une puce. C'est mon scénario le plus probable si tout se passe bien
Selon Elon Musk c'est justement l'inverse qui risque de se produire , le taux de mortalité est plus élevé que le taux de natalité. (Par exemple en Chine, ça va être l'hécatombe bientôt..)Tout à fait en accord avec toi.
Je ne suis pas du tout du style "c'était mieux avant"
Ce que je voulais surtout mettre en avant dans l'immortalité, c'est que ....nous ne mourrions plus. et oui lol
Mais on va continuer à avoir des enfants, et on sait déjà que nous sommes déjà trop sur la planête pour couvrir les besoins.
A voir avec l'IA si elle peut offrir une aide à cela
Après tu pourras toujours mourir d'accidents ect.. Sauf si on arrive à télécharger notre conscience.Comment apprécier la vie si elle est sans fin et sans crainte finalement.
Ne nous perdrions nous pas.