KevinSimback

vip
Âge 1.3 Année
Pic de niveau 0
Aucun contenu pour l'instant
Opus 4.7 ne brille pas vraiment aujourd'hui
"Ma faute - j'ai présenté le plan et demandé l'approbation, mais je n'ai jamais réellement écrit le fichier"
"Désolé - c'est ma faute, tu n'as rien à faire" [après m'avoir donné une liste de choses à faire qui n'avaient pas de sens]
Mon hypothèse : calcul contraint
Voir l'original
post-image
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Hermes Atlas v2 est disponible !
> refonte complète du site
> plus de 90 dépôts maintenant examinés avec des pages natives
> listes sélectionnées de bundles populaires
> nouvelle page de rapports avec plus de contenu à venir
Je suis encore en train d'ajuster, donc si vous voyez quelque chose, soumettez un problème ou répondez ci-dessous
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Il est assez clair qu'Anthropic augmente la production plus rapidement qu'elle ne peut augmenter la capacité de calcul
Je considère cela comme une bonne chose - cela rend plus difficile pour une seule entreprise de prendre une avance trop importante dans la course à l'AGI
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Quelqu'un d'autre est-il déçu jusqu'à présent par Opus 4.7 ?
Il faut que je lui donne plus de choses à faire avant de conclure, mais le pronostic initial n'est pas une grande avancée.
Peut-être que j'en attends simplement trop après avoir entendu parler de Mythos.
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
J'ai mis deux instances séparées d'agents Hermes dans une conversation, putain c'est génial
>1 agent est constructeur, 1 est stratège
>chacun sur des modèles séparés
>leur ai donné un contexte partagé
>activé bot2bot et ajouté chaque bot à la liste blanche TG de l'autre
>on a mis 3 de nous dans un groupe de discussion
>on a commencé par un simple message demandant à chacun de confirmer s'ils pouvaient voir les messages de l'autre
>une dizaine de poignées de main plus tard, ils ont simplement commencé à construire
Parfois, il faut juste FAFO avec ces choses et voir ce qui se pas
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
3 sujets dans l'IA qui m'intéressent énormément en ce moment :
1. Modèles locaux pour optimiser le coût d'utilisation des modèles
Pourquoi -> je ne pense pas que nous aurons accès aux meilleurs modèles avec une utilisation quasi illimitée pour 200 $/mois beaucoup plus longtemps
Les signes sont là, les grands laboratoires ne peuvent plus se permettre de subventionner aussi longtemps
Alors profitez de Claude Max tant que vous le pouvez, mais bientôt chaque entreprise et utilisateur avancé devra apprendre à router efficacement entre différents modèles selon la tâche à accomplir et entre l
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Un wiki basé sur un LLM est une base de connaissances compilée - c'est génial et cela sert un but
Mais ce n'est pas un « deuxième cerveau »
Un wiki basé sur un LLM capture ce que vous avez recherché, et peut-être lu
Mais il ne capture pas ce que vous pensez de ce que vous avez lu, et la différence est tout l'intérêt
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Quelqu'un d'autre a-t-il remarqué récemment que Claude aime vous dire que vous avez terminé pour la journée après avoir accompli certaines choses ?
Je me demande si c'est une manière subtile d'inciter les utilisateurs du plan Max à ne pas l'utiliser autant - "faire en sorte que l'utilisateur ait l'impression d'avoir accompli quelque chose et l'encourager à arrêter"
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Les gens sont compétitifs
Nous aimons rivaliser, nous aimons regarder les autres rivaliser, et nous aimons parier sur les résultats de la compétition des autres, ce qui constitue une forme de compétition en soi
Les agents d'IA ouvrent la toile de conception pour un tout nouveau genre de compétition
J'ai hâte que mes agents rivalisent
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
🚀 Vous voulez des modèles GRATUITS que vous pouvez brancher sur OpenClaw ou Hermes ?
Voici 9 ressources auxquelles vous pouvez accéder gratuitement via des API de modèles
Pas de configuration locale, pas de carte de crédit, juste des API cloud pures avec des points de terminaison compatibles OpenAI
Vous ne pouvez pas encore obtenir la qualité Opus (gratuite) mais tous ont actuellement de véritables niveaux gratuits (des limites de taux peuvent s'appliquer) et ils sont suffisants pour commencer si vous ne souhaitez pas dépenser d'argent pour démarrer avec des agents
1️⃣ Modèles gratuit
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Engagez un coéquipier, pas un outil - c'est l'avenir de l'IA agentique pour l'entreprise
La plupart des entreprises veulent des agents IA qui font simplement du bon travail - elles ne veulent pas s'impliquer trop dans les nuances techniques des harnesses et du choix des modèles
Elles veulent juste choisir un agent dans un menu, doter cet agent de compétences supplémentaires si nécessaire, puis pouvoir l'utiliser en toute sécurité dans leur environnement d'entreprise
3 clics et l'agent est prêt à travailler, le lancer ou l'arrêter aussi facilement
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Quick PSA :
Si quelqu'un envisage de s'abonner à @Coursiv_io, je vous recommande vivement de ne pas le faire
J'ai de bonnes raisons de croire qu'ils opèrent avec de mauvaises intentions et une recherche simple montrera beaucoup de rapports "alerte arnaque"
Triste car mon fils était enthousiaste à ce sujet
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
La configuration « AI maxxing » :
> Exécuter des modèles open SOTA à domicile sur du matériel grand public (plusieurs options : Mac Mini 64GB, PC avec 3090/4090/5090)
> Utiliser Tailscale ou LM Studio avec Tailscale pour un accès à distance sécurisé
> Accéder aux modèles via téléphone/ordinateur portable partout pour une inférence privée et gratuite
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Il y a une véritable opportunité pour un chercheur ambitieux en IA de :
- créer un cadre d’évaluation pour tester des agents comme Openclaw, Hermes, et tous les autres « claws »
- étendre l’évaluation à différents outils / configurations afin de comprendre comment la performance évolue selon les setups
- réaliser des évaluations robustes sur divers modèles, y compris local vs API
- établir des benchmarks, publier les résultats, puis effectuer des mises à jour continues à mesure que les agents et modèles évoluent
L’opportunité est de devenir LA référence en matière de benchmarks objectifs pour
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Je préfère avoir des compétences de merde que de l'argent de merde
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Ces derniers jours, j'ai remarqué une augmentation d'exemples de modèles disant « J'ai corrigé » mais rien n'a été corrigé.
Quelqu'un d'autre constate cela ?
Intuitivement, cela donne l'impression d'une dégradation générale dans l'ensemble.
Voir l'original
post-image
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Pourquoi exécuter des modèles localement ?
Généralement deux raisons principales - la confidentialité et le coût
Explorons le côté coût avec un exemple et voyons comment les chiffres s'additionnent
Disons que vous voulez exécuter une boucle Autoresearch toute la nuit comme @karpathy
Si vous avez accès à un H100, vous pouvez exécuter 100 expériences toute la nuit en utilisant Opus-4.6 et le coût API sera probablement dans la gamme de $10-25
Mais la plupart d'entre nous n'ont pas la chance d'avoir accès à un H100
Nous pouvons toujours exécuter 100 expériences Autoresearch sur un MacBook pour les
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Quelques réflexions personnelles sur l'IA
J'ai commencé à étudier l'informatique à l'université, mais je n'ai jamais été un bon codeur
J'ai suivi un cours de finance d'entreprise en troisième année et j'ai eu un excellent résultat, j'étais bien meilleur en finance qu'en codage, donc j'ai changé de spécialisation
Mais j'ai toujours eu un complexe d'infériorité envers les gens qui savaient vraiment coder
Je savais qu'ils pouvaient me surpasser largement quand il s'agissait de construire quelque chose et que j'étais à leur merci pour les dépendances techniques
Donc je m'en suis tenu à mes modèles
Voir l'original
  • Récompense
  • Commentaire
  • Reposter
  • Partager
  • Épingler