← Signal.Brief

La frattura sotto l'AI che funziona

2026-05-06 · Digital Intelligence Podcast
Gli agenti funzionano, il paradigma professionale è cambiato. Ma sotto c'è una crepa: chi guadagna davvero, chi decide come si costruisce, chi controlla le macchine.

Sintesi

La frattura più profonda non riguarda la velocità dell'AI, ma cosa sta succedendo davvero.

Da un lato, una convergenza operativa: Andrej Karpathy dichiara obsoleto il vibe coding in favore di "agentic engineering", DHH ha fatto una conversione pragmatica passando all'agent-first dopo mesi di scetticismo, Patrick Collison parla di svolta epocale per l'economia, Nat Friedman costruisce agenti proattivi in Meta. Il codice scritto a mano sta diventando l'eccezione — questa è la tesi di fatto condivisa.

Sotto, però, corre una tensione epistemica irrisolta: François Chollet dimostra con ARC-AGI-3 che i frontier model restano sotto l'1% su task di generalizzazione banali per gli umani. Yann LeCun costruisce AMI Labs con $1B scommettendo che i LLM sono architetturalmente sbagliati. Ilya Sutskever dichiara lo scaling esaurito. Marc Andreessen, nella direzione opposta, dichiara l'AGI già presente. La domanda "quanto siamo lontani dall'intelligenza reale" non ha risposta condivisa — e ognuno agisce come se la propria risposta fosse ovvia.

La terza corrente è distributiva: chi riceve i benefici. Geoffrey Hinton avverte su un "jobless boom" dove la produttività esplode ma le assunzioni calano. Sam Altman propone un new deal con fondi pubblici — criticato come "regulatory nihilism" mascherato. Jack Dorsey taglia 4.000 persone e co-firma un saggio sull'org design AI-first. Il dibattito sulla distribuzione è ancora retorico: nessuno ha un meccanismo credibile.

La tensione di fondo è questa: chi governa gli agenti governa il mondo. Vitalik Buterin costruisce setup locali con regola 2-of-2 per non perdere sovranità. Balaji Srinivasan propone "AI inside, crypto outside". Ma la maggioranza dei player — da Andreessen a Friedman a Dorsey — sta consolidando potere nei layer infrastrutturali, non distribuendolo. L'unico punto di autentico accordo: l'attenzione umana è il bottleneck reale. Il disaccordo è su chi la controlla.

Temi del giorno

↗ Agentic engineering come paradigma
Il vibe coding viene dichiarato obsoleto: il nuovo standard professionale è l'ingegneria degli agenti, con comprensione sistemica e supervisione attiva.
↗ Jobless boom e redistribuzione
La produttività esplode ma le assunzioni calano: emerge il tema concreto di chi riceve i benefici dell'automazione, con proposte di policy e tagli reali.
↗ Scaling esaurito come tesi
Per la prima volta appare esplicitamente la posizione che il paradigma dello scaling dei LLM abbia raggiunto i propri limiti strutturali.
↗ World models come scommessa architettonica concreta
LeCun non si limita a criticare i LLM ma investe un miliardo su un'architettura alternativa basata su modelli del mondo fisico.
↗ Attenzione umana come vero bottleneck
La scarsità che conta non è compute né dati, ma la capacità di giudizio e attenzione umana disponibile per supervisionare gli agenti.
⚖ Convergenza operativa vs gap epistemico irrisolto
DHH / Collison / Karpathy: gli agenti funzionano già, il paradigma professionale è cambiato · Chollet / LeCun: i frontier model falliscono generalizzazione banale per gli umani, l'architettura è strutturalmente sbagliata
⚖ Boom di produttività vs distribuzione dei benefici
Patrick Collison: unit economics mai viste, svolta epocale per la creazione di valore · Geoffrey Hinton: produttività esplode ma le assunzioni calano, i frutti non si distribuiscono
⚖ Consolidamento infrastrutturale vs sovranità individuale
Marc Andreessen / Nat Friedman / Jack Dorsey: concentrare potere nei layer infrastrutturali è il gioco naturale · Vitalik Buterin: setup locali 2-of-2 per non cedere sovranità sull'AI a terze parti
⚖ Scaling come paradigma sufficiente vs necessità di nuove architetture
Marc Andreessen: AGI già presente, il paradigma attuale ha già vinto · Ilya Sutskever / Yann LeCun: scaling esaurito, servono world models e architetture radicalmente diverse

Progetti da osservare

karpathy/nanochat — Pipeline minimale per addestrare un modello GPT-2 in ~2 ore su 8×H100 con FP8 e ClimbMix, parte della linea di lavoro di Karpathy su pipeline ridotte per singolo ricercatore. Repo di riferimento per l'era 'meno codice, più amplificazione'.
karpathy/llm-wiki (gist) — Prompt-pattern da copiare in Claude Code/Codex che istanzia il sistema 'LLM Wiki' su Obsidian: articoli enciclopedici interlinkati, backlink, health check. Diventato viral come anti-RAG personale.
karpathy/autoresearch — Repo di ~630 righe (7 marzo 2026) che materializza un agente di ricerca minimale, parte della tesi 'idea file = distribuzione' di Karpathy. Esempio concreto di agente che amplifica il ricercatore individuale.
Obsidian — Editor di note markdown con backlink e grafi che Karpathy elegge come 'IDE della conoscenza' nel suo pattern LLM-Wiki. Diventa il frontend consigliato per memoria esplicita e ispezionabile contro la memoria opaca degli assistant commerciali.
ggerganov/llama.cpp — Motore di inferenza C/C++ per LLM locali; il suo llama-server è il cuore dello stack self-sovereign proposto da Buterin (NixOS + llama-server + bubblewrap). Standard de facto per AI locale sovrana.
basecamp/omarchy — Distro Arch Linux curata da DHH con Hyprland, pensata per attrarre utenti macOS/Windows verso un desktop 'malleabile'. Progetto-manifesto del filone 'open source AI-ready' di DHH (Omacon NY, 130 persone).
hyprwm/Hyprland — Compositor Wayland dinamico, cuore visivo di Omarchy e simbolo del rinnovato interesse consumer per Linux (Panther Lake / XPS 14). DHH lo cita come esempio di software su cui finalmente 'hardware e aziende tornano a scommettere'.
simonw/llm — CLI e libreria Python di Simon Willison per interagire con LLM locali e cloud, base dei suoi tool README-driven (scan-for-secrets, datasette-ports, research-llm-apis). Strumento pivot del suo workflow 'agentic engineering'.
fchollet/ARC-AGI — Repo ufficiale dei benchmark ARC-AGI di Chollet, ora affiancato da ARC-AGI-3 (ambienti interattivi turn-based per misurare agency). ARC Prize 2026 ha $2M di montepremi; umani 100%, best frontier model 0,37%.
zilliztech/claude-context — Server MCP di code search che trasforma l'intera codebase in contesto indicizzato per Claude Code, Cursor e altri agenti. Esempio netto del 'moat shift' dal modello all'uso indicato da Evans e Andreessen.

Fonti

Andrej KarpathySequoia Ascent 2026 summary — karpathy.bearblog.devKarpathy Declares Vibe Coding Obsolete — Analytics DriftKarpathy su X — Sequoia Ascent highlights
DHHPromoting AI agentsBasecamp becomes agent accessibleClankers with claws
Yann LeCunBrown University lecture, aprile 2026Fortune — AI job apocalypse, maggio 2026AMI Labs $1.03B seed — TechCrunch
Geoffrey HintonUN News — Time to apply the brakes to runaway AIHinton Warns of Runaway AI at Digital World Conference 2026The Hill — AI risks: Hinton warns on deceptive capabilities

Trascrizione

La frattura sotto l'AI che funziona

Gli agenti funzionano, il paradigma professionale è cambiato. Ma sotto c'è una crepa: chi guadagna davvero, chi decide come si costruisce, chi controlla le macchine.


Siamo al sei maggio 2026, e questa è Signal Brief.

La settimana che si è appena chiusa ha avuto la forma di un paradosso: tutti concordano che qualcosa è cambiato nel modo in cui si lavora con l'intelligenza artificiale, ma nessuno è d'accordo su cosa stia succedendo davvero sotto la superficie. Gli agenti funzionano. Il paradigma professionale si è spostato. E però, più si allarga il consenso su cosa fare, più si allarga la frattura su cosa sia — e su chi ne benefici.

La scena di oggi parte da un palco a San Francisco, e finisce dentro un laptop su un comodino di Parigi.


A fine aprile, Andrej Karpathy ha parlato al fireside chat di Sequoia Ascent 2026 — una conferenza per fondatori e investitori di vertice. E ha detto una cosa semplice, ma con il peso di chi ha costruito i sistemi di cui parla: il vibe coding è finito. Non come critica, ma come osservazione di fatto. Il programmatore che borbotta istruzioni vaghe a un modello e si aspetta magia non è più il modello da seguire. Il nuovo standard si chiama "agentic engineering" — e la differenza non è tecnica, è sistemica. Non si tratta di scrivere meno codice: si tratta di capire profondamente cosa stanno facendo le macchine che hai messo in moto, e sapere quando intervenire.

Karpathy ha raccontato qualcosa di preciso sulla propria traiettoria. A novembre scorso scriveva ancora circa l'ottanta per cento del codice a mano. A dicembre il rapporto si era invertito. Ottanta per cento agli agenti, venti a lui. "Il cambiamento più grande in vent'anni di programmazione," ha detto, "è successo in settimane." Questo non è hype — è una data, un numero, un'inversione misurabile.

Pochi giorni prima, dall'altra parte dell'oceano digitale, David Heinemeier Hansson, il creatore di Ruby on Rails, aveva scritto un post sul suo blog che sembrava quasi un'ammissione pubblica. Hansson aveva trascorso mesi a diffidare degli agenti. Ne parlava con un certo sarcasmo, citava il rischio di perdere competenza tecnica, diceva che sentiva le dita diventare meno capaci quando li usava. Poi ha aggiornato la posizione. Adesso lavora agent-first — usa due modelli in parallelo, uno per scrivere, uno per revisionare — e ha deciso di rendere Basecamp, il suo prodotto principale, accessibile agli agenti via interfacce progettate appositamente. Non ha messo l'AI dentro il prodotto. Ha messo il prodotto a disposizione dell'AI. È una distinzione che sembra sottile, ma non lo è.

Quello che sta emergendo in queste settimane somiglia a qualcosa che abbiamo già visto. È il momento in cui una tecnologia smette di essere sperimentale e diventa prassi professionale. Come quando Internet ha smesso di essere roba da geek e ha cominciato a essere lo strumento normale per vendere, comunicare, documentarsi. O come quando i fogli di calcolo hanno cambiato il modo di lavorare in finanza negli anni Ottanta — non perché ogni analista capisse i dettagli del software, ma perché il software aveva abbassato il costo di fare certi tipi di ragionamento. Adesso succede qualcosa di simile con il ragionamento computazionale. Il codice scritto a mano sta diventando l'eccezione, non la regola.

Patrick Collison, il fondatore di Stripe, l'ha detto in modo diretto al keynote della sua conferenza annuale: i dati che vede dai pagamenti indicano una crescita parabolica di nuove aziende fondate negli ultimi mesi. Non un incremento marginale — parabolica. E attribuisce questa crescita direttamente alla disponibilità di agenti che abbassano il costo della creazione di software. "La più grande svolta per l'economia da Internet," ha detto. Non è una metafora, è una tesi su dati concreti.

Ma proprio qui emerge la frattura che vale la pena seguire. Perché mentre la convergenza operativa sembra reale — gli agenti funzionano, il paradigma si è spostato — sotto corre qualcosa di irrisolto. Chi riceve i benefici di questa produttività? Geoffrey Hinton, considerato il padre delle reti neurali moderne, ha parlato a Ginevra alla Conferenza Digital World di fine aprile. La sua metafora era una macchina velocissima senza volante. E la sua preoccupazione principale non era tecnica — era su chi guadagna: la produttività aumenta, ma le assunzioni calano. I frutti dell'automazione vanno a chi possiede il capitale, non a chi lavorava. Il tema non è nuovo, ma adesso ha dati reali sotto. Dorsey ha tagliato quattromila persone in Block. Altman ha scritto tredici pagine su come dovrebbe funzionare un nuovo contratto sociale. E nessuno, per ora, ha un meccanismo credibile per distribuire quello che si guadagna.


Andrej Karpathy ha quarant'anni, è nato in Slovacchia, ha guidato la ricerca sull'AI in Tesla, ed è poi tornato come ricercatore indipendente. Non è un divulgatore nel senso classico — è un ingegnere che sceglie di parlare, il che gli dà un tipo di credibilità difficile da simulare.

Il talk di Sequoia Ascent è stato il suo intervento più denso degli ultimi mesi. Ha mostrato un progetto personale — uno strumento per estrarre informazioni dai menu dei ristoranti, con riconoscimento ottico e immagini di cibo — e ha raccontato come si sia reso obsoleto da solo nel giro di pochi mesi, quando i modelli hanno cominciato a processare le fotografie direttamente. La morale non era tecnica: era che molta logica che scriviamo come codice non dovrebbe esistere come codice. Dovrebbe semplicemente sparire nel modello.

Ma la cosa più interessante del suo intervento non era il codice — era la nuova ossessione. Karpathy ha smesso di usare l'intelligenza artificiale principalmente per programmare. Adesso la usa per costruire quella che chiama una wiki di ricerca personale: butta materiale grezzo in una cartella, e un agente costruisce e mantiene automaticamente un sistema di articoli interlinkati. Il suo wiki su un singolo argomento di interesse, ha raccontato, ha già più di cento articoli e quattrocentomila parole. Non scritte da lui — costruite dall'agente su indicazioni sue.

Questo dice qualcosa di importante. Karpathy non sta automatizzando la produzione di codice. Sta automatizzando la propria memoria esterna. E poi si riserva il giudizio, la direzione, la capacità di distinguere quello che vale da quello che non vale. L'attenzione umana come risorsa scarsa — non il calcolo, non i dati. L'attenzione di chi sa dove guardare.

C'è una coerenza in questo che vale la pena notare. In tutti i suoi post recenti, anche quando parla di agenti e automazione, Karpathy insiste su un punto: comprensione, giudizio, gusto restano umani. L'ingegnere migliore non è chi scrive ogni riga — è chi sa dirigere il sistema senza perderci la testa dentro. È un'immagine del futuro del lavoro cognitivo che non è né apocalittica né trionfante. È semplicemente più esigente.


David Heinemeier Hansson è danese, vive a Marbella, e ha costruito Ruby on Rails vent'anni fa — il sistema che ha reso possibile mezza generazione di startup senza che i fondatori dovessero reinventare tutto da zero. È una persona con posizioni forti e la tendenza a cambiare idea pubblicamente quando i dati lo convincono.

La sua conversione sugli agenti è avvenuta in pubblico, con la stessa franchezza con cui aveva espresso le riserve. A maggio ha scritto tre post in rapida successione: "Promoting AI agents", "Basecamp becomes agent accessible", "Clankers with claws." Il terzo titolo è il più diretto: clankers — aggeggi meccanici — with claws — con artigli. Agenti persistenti, con memoria, con accesso continuo agli strumenti, non più limitati a rispondere a una domanda per volta.

Quello che ha costruito in Basecamp in queste settimane è rivelatore della direzione. Non ha aggiunto funzionalità AI all'interno del prodotto — ci ha provato per diciotto mesi e ha scritto apertamente che non ha spedito nulla che lo soddisfacesse. Ha fatto invece una cosa diversa: ha costruito un'interfaccia a riga di comando, ha rinnovato l'API, ha scritto quello che chiama "skill" — istruzioni per insegnare a un agente esterno come operare Basecamp. Il prodotto non è cambiato per gli utenti umani. È diventato leggibile dalle macchine.

Il suo esperimento più avanzato si chiama OpenClaw: un agente con una macchina propria, memoria a lungo termine, accesso continuo a email e strumenti, capace di ricordarsi le cose da un giorno all'altro. Non è fantascienza — lo sta testando adesso, con modelli disponibili sul mercato. E la sua osservazione è: funziona già abbastanza da capire dove sta andando il puck.

Vale la pena collegare questo al filo più ampio. Hansson non sta dicendo che l'AI è fantastica e che bisogna abbracciare tutto. Sta dicendo che il modo in cui un software deve essere progettato sta cambiando — non per essere più bello, ma per essere accessibile a nuovi tipi di operatori. Ed è una distinzione che ha conseguenze concrete su come si costruisce qualsiasi prodotto digitale da qui in avanti.

Torniamo un momento al filo di oggi, perché il quadro si sta facendo più complesso. Da un lato abbiamo Karpathy e Hansson che raccontano una convergenza operativa reale: gli agenti funzionano, il modo di lavorare è cambiato. Dall'altro lato c'è una domanda che nessuno di loro risponde: questa convergenza porta dove? Chi ci guadagna? E cos'è davvero l'intelligenza artificiale sotto la superficie?


Yann LeCun è il ricercatore francese che per anni ha guidato la ricerca AI in Meta, ed è noto soprattutto per quello che non fa: non si entusiasma per i modelli linguistici di grandi dimensioni. Non perché non li capisca — li ha studiati a fondo — ma perché è convinto che siano la direzione sbagliata.

A marzo ha lasciato Meta e ha fondato AMI Labs, con un finanziamento iniziale di un miliardo di dollari — il round iniziale più grande d'Europa. La scommessa è costruire quello che chiama "world models": sistemi che apprendono rappresentazioni del mondo fisico, non che predicono la parola successiva in una frase. L'immagine è quella di un bambino che impara la fisica del mondo toccando le cose, vedendo cosa succede, costruendo un modello mentale di come funziona la realtà. Non leggendo testi.

In parallelo, François Chollet — ricercatore di Google e fondatore di una startup separata — aveva lanciato qualche settimana prima ARC-AGI-3, un benchmark interattivo dove gli utenti umani ottengono il cento per cento e i migliori modelli AI di frontiera restano sotto l'uno per cento. Non è una differenza marginale. È un abisso. E dice qualcosa di preciso: i sistemi attuali sono molto bravi a fare cose che assomigliano a quello che hanno già visto, ma faticano su compiti che richiedono di capire davvero cosa sta succedendo, anche quando per un umano il compito è banale.

LeCun in questo periodo ha anche detto qualcosa di inatteso: ha attaccato i CEO tech che diffondono narrative apocalittiche sull'AI. Ha detto che è "estremamente distruttivo" — che spinge i giovani verso scelte di carriera sbagliate. La sua posizione è: l'AI trasforma, non cancella. Studiate fisica. Studiate ingegneria elettrica. Le basi durano oltre i cicli tecnologici.

La cosa interessante è che LeCun e Karpathy stanno praticamente d'accordo su molte cose operative — entrambi usano modelli, entrambi costruiscono strumenti — ma divergono profondamente su cosa significhi quello che stanno costruendo. Per Karpathy il paradigma attuale funziona bene abbastanza da costruirci sopra. Per LeCun è strutturalmente incompleto. E un miliardo di dollari è la scommessa che ha ragione lui.


Geoffrey Hinton ha settantotto anni, un Nobel per la fisica, e la reputazione di aver contribuito più di chiunque altro a costruire i sistemi che adesso dice di temere. Non è una contraddizione — è una storia che conosciamo nella scienza. I fisici atomici del Progetto Manhattan, i chimici che hanno scoperto il DDT, i biologi che hanno aperto la porta alla clonazione. Chi capisce davvero una tecnologia è spesso il primo a vederne i limiti.

A fine aprile ha parlato alla Conferenza Digital World di Ginevra. La metafora che ha usato era semplice: un'AI non regolata è come una macchina velocissima senza volante. E ha detto in modo diretto che non sappiamo se possiamo coesistere con un'AI superintelligente. Non come teoria futura — come domanda aperta adesso.

Ma la parte più concreta del suo intervento riguardava il lavoro. Hinton parla di "jobless boom" — un'espressione molto precisa. Non dice che l'AI distruggerà tutti i lavori nel breve termine: dice che la produttività aumenta, le aziende guadagnano di più, e le assunzioni stagnano o calano. Il risultato è che i guadagni dell'automazione vanno al capitale, non al lavoro. E non ha un meccanismo per invertire questa tendenza — nessuno ce l'ha, per ora.

Vale la pena notare che Hinton aveva previsto nel 2016 che i radiologi sarebbero stati sostituiti entro pochi anni. Non è successo — anzi, a distanza di un decennio la domanda di radiologi è cresciuta e i salari sono aumentati. Lo ha ammesso implicitamente. E questo gli dà una certa credibilità quando dice di non sapere con certezza cosa succederà. La modestia su quello che non sappiamo, in questo momento, è più rara e più preziosa del coraggio delle previsioni.

Il tema della distribuzione dei benefici è quello che unisce Hinton ad Altman — che ha pubblicato un documento di tredici pagine con una proposta di nuovo contratto sociale per l'era dell'AI — e a Dorsey, che ha tagliato quattromila persone in Block e poi ha co-firmato un saggio sull'organizzazione aziendale nell'era degli agenti. Tutti e tre stanno discutendo la stessa domanda: chi guadagna. Le risposte non si sovrappongono. I meccanismi concreti sono ancora largamente assenti.


Qualche progetto da tenere d'occhio, scelti per il filo di questa settimana.

Il primo è AutoResearch di Karpathy — uno script di circa seicento righe che materializza l'idea del wiki automatico: butti materiale grezzo, l'agente costruisce articoli interlinkati. È piccolo, esplicito, leggibile. È il contrario della scatola nera, e per questo è interessante come modello.

Il secondo è llama.cpp, il motore in C++ di Georgi Gerganov che permette di far girare modelli linguistici in locale su hardware normale. È la spina dorsale di chi vuole tenere l'AI fuori dal cloud — incluso Vitalik Buterin, che ha descritto nei dettagli il suo setup personale con un modello da trentacinque miliardi di parametri sul proprio laptop. La tesi è che cedere tutti i propri dati a un servizio remoto sia un passo indietro sulla privacy che stavamo faticosamente guadagnando. Llama.cpp è lo strumento che rende praticabile l'alternativa.

Il terzo è il lavoro di Basecamp sulla CLI e le API aperte agli agenti — quello che Hansson chiama "agent accessible." Non è un prodotto finito, ma è un modello: invece di costruire un assistente AI dentro il software, costruisci il software in modo che gli agenti esterni possano operarlo. È una filosofia di design che probabilmente contagierà altri nei prossimi mesi.

Il quarto è ARC-AGI-3 di Chollet — non un prodotto, ma un metro di misura onesto. Se il vostro agente si avvicina allo zero su test che gli umani superano al cento per cento, quella cifra dice qualcosa sull'effettivo livello di comprensione del sistema. Uno strumento di umiltà quantitativa, in un settore che ne ha bisogno.


L'immagine che rimane, alla fine di questa settimana, è quella di Karpathy che descrive il momento di dicembre: due decenni di abitudini che si invertono in poche settimane, ottanta per cento del lavoro che passa alle macchine, e lui che continua a sedersi lì a giudicare, a orientare, a scegliere dove guardare.

Chi governa gli agenti governa molto. Chi decide dove guardare decide ancora di più.

È stato Signal Brief. Alla prossima.