← Signal.Brief

Dalla scala al mestiere

2026-05-27 · Digital Intelligence Podcast
Maggio 2026: la corsa all'AI cambia natura. Non più "quanto è potente" ma "come la integro senza perderci dentro". Una mappa della transizione in corso.

Sintesi

Maggio 2026: La Transizione da Scala a Architettura

Sotto il rumore di narrative accelerazioniste emerge un tema coeso: l'AI non è più una questione tecnologica pura, è una transizione organizzativa.

Convergenza pragmatica su integrazione operativa.

Andrej Karpathy e DHH occupano poli opposti politicamente ma convergono su diagnostica identica: AI è utile solo quando integrata nel processo cognitivo del team. Karpathy parla di "vibe coding" come filosofia: AI completa intuizione architetturale, non rimpiazza competenza. DHH ha abbandonato scetticismo storico, usa ora Opus/Gemini 2.5 in tmux, ma mantiene threshold artigianale—codice degno di merge minimo. Simon Willison sposta metrica da perfezione a usabilità: meglio prodotto lanciato in due settimane che architettura perfetta mai utilizzata. Il segnale: produttività è vincente solo se traducibile.

Scetticismo strutturale su narrative vs. dati reali.

Benedict Evans identifica frattura epistemica: narrativa singolarità vs. zero metriche operative (contrappone dati Stripe a storie vuote). John Carmack dichiara esplicitamente "we are not on the brink of AGI", timeline 50-60% al 2030, focus su causalità embodied, non scaling. Nat Friedman riconosce bolla ma continua per pragmatismo coercitivo, diagnostica il vero bottleneck: non compute, ma interfaccia produttiva. Gap fra capex infrastrutturale (Nvidia, DeepMind dominano) e densità commerciale applicativa (nessuna unicorn AI proprietary revenue model).

Centralizzazione infrastrutturale come realtà, nonostante narrativo decentramento.

Jensen Huang proietta $3-4 trilioni capex decennio, Vera Rubin come nuovo TAM. Evans: "2-4 firm dominano ricerca, Nvidia consolida semiconduttori, distribuzione batte moat tecnico". Demis Hassabis nomina Seoul/Lee Sedol comeback come contromossa geopolitica, ma il segnale riconosce concentrazione.

Riconoscimento ironico: craft e specializzazione come risposta all'automazione. Patrick Collison enfatizza "harnesses for increasing intelligence"—architetture prodotto resilientino oltre singolo modello. DHH archivia VC, piccoli team skilled (designer:engineer 1:2). Paradosso: maggiore automazione = maggiore esigenza di discernimento umano su cosa costruire, non come costruirlo.

Tensione risolvibile: velocità vs. causalità. Chi frena (Carmack) e chi accelera (Huang) operano su assi diversi—ricerca fundamentale vs. infrastruttura. Maggio 2026 è momento in cui l'AI smette di essere "quanto è smart?" e diventa "come lo gestisco in team senza rompere intelligibilità umana?"

Temi del giorno

↗ Vibe coding come filosofia operativa
AI integrata nel processo cognitivo del team, completa intuizione piuttosto che rimpiazzare competenza; pratica dichiarata da Karpathy, DHH, Willison
↗ Bottleneck come interfaccia produttiva, non compute
Il vero vincolo è la traduzione di capacità computazionale in output commerciale usabile; gap infrastruttura vs applicazione
↗ Paradosso automazione-discernimento
Maggiore automazione richiede crescente esigenza di giudizio umano su cosa costruire, non su come costruirlo
↗ Riconoscimento della bolla con continuazione coercitiva
Ammissione esplicita che sector è in bolla, ma capex già deployato forza prosecuzione del ciclo
⚖ Accelerazionismo capex infrastrutturale vs. scetticismo fundamentale
Jensen Huang: trilioni capex decennio, scaling continuo, Vera Rubin nuovo TAM · John Carmack: AGI 50-60% al 2030, fundamentals embodied learning, causalità prima scala
⚖ Narrativa singularità vs. bottleneck operativo reale
Narrativa accelerazionista: capability gap è il constraint principale · Evans/Friedman/Carmack: constraint vero è interfaccia produttiva e intelligibilità umana, non compute raw
⚖ Integrazione AI nel workflow vs. sostituzione implicita
DHH/Willison/Karpathy: AI integrata con threshold artigianale, completa intuizione, no replacement · Narrativa bolla: AI rimpiazza decisioni, competenze, progettazione nel medio termine

Progetti da osservare

karpathy/nanochat — Pipeline minimale per addestrare un modello GPT-2 in ~2 ore su 8×H100 con FP8 e ClimbMix, parte della linea di lavoro di Karpathy su pipeline ridotte per singolo ricercatore. Repo di riferimento per l'era 'meno codice, più amplificazione'.
karpathy/llm-wiki (gist) — Prompt-pattern da copiare in Claude Code/Codex che istanzia il sistema 'LLM Wiki' su Obsidian: articoli enciclopedici interlinkati, backlink, health check. Diventato viral come anti-RAG personale.
karpathy/autoresearch — Repo di ~630 righe (7 marzo 2026) che materializza un agente di ricerca minimale, parte della tesi 'idea file = distribuzione' di Karpathy. Esempio concreto di agente che amplifica il ricercatore individuale.
Obsidian — Editor di note markdown con backlink e grafi che Karpathy elegge come 'IDE della conoscenza' nel suo pattern LLM-Wiki. Diventa il frontend consigliato per memoria esplicita e ispezionabile contro la memoria opaca degli assistant commerciali.
ggerganov/llama.cpp — Motore di inferenza C/C++ per LLM locali; il suo llama-server è il cuore dello stack self-sovereign proposto da Buterin (NixOS + llama-server + bubblewrap). Standard de facto per AI locale sovrana.
basecamp/omarchy — Distro Arch Linux curata da DHH con Hyprland, pensata per attrarre utenti macOS/Windows verso un desktop 'malleabile'. Progetto-manifesto del filone 'open source AI-ready' di DHH (Omacon NY, 130 persone).
hyprwm/Hyprland — Compositor Wayland dinamico, cuore visivo di Omarchy e simbolo del rinnovato interesse consumer per Linux (Panther Lake / XPS 14). DHH lo cita come esempio di software su cui finalmente 'hardware e aziende tornano a scommettere'.
simonw/llm — CLI e libreria Python di Simon Willison per interagire con LLM locali e cloud, base dei suoi tool README-driven (scan-for-secrets, datasette-ports, research-llm-apis). Strumento pivot del suo workflow 'agentic engineering'.
fchollet/ARC-AGI — Repo ufficiale dei benchmark ARC-AGI di Chollet, ora affiancato da ARC-AGI-3 (ambienti interattivi turn-based per misurare agency). ARC Prize 2026 ha $2M di montepremi; umani 100%, best frontier model 0,37%.
zilliztech/claude-context — Server MCP di code search che trasforma l'intera codebase in contesto indicizzato per Claude Code, Cursor e altri agenti. Esempio netto del 'moat shift' dal modello all'uso indicato da Evans e Andreessen.

Fonti

DHHCreator of Ruby on Rails warns AI coding tools may be eroding programming fundamentalsDHH on AI, Vibe Coding and the Future of ProgrammingLex Fridman Podcast #474 Transcript
John CarmackD CEO Magazine interview - novembre 2025The Register - "We are not on the brink of AGI"Geeky Gadgets - Game-playing robots

Trascrizione

Dalla scala al mestiere

Maggio 2026: la corsa all'AI cambia natura. Non più "quanto è potente" ma "come la integro senza perderci dentro". Una mappa della transizione in corso.


C'è un momento, in ogni grande trasformazione tecnologica, in cui si smette di parlare della potenza dello strumento e si comincia a parlare di chi sa usarlo. Sta succedendo adesso con l'intelligenza artificiale, e sta succedendo in fretta. Questa settimana, ascoltando le voci più attente del settore, emerge un cambio di passo che non riguarda i modelli ma il mestiere. È il tema di questa puntata di Signal Brief, oggi 27 maggio 2026. Una storia che ruota intorno a una parola buffa, "vibe coding", e a una domanda molto seria: qual è davvero il collo di bottiglia, oggi.


Partiamo da una scena piccola, quasi domestica. Andrej Karpathy, uno dei ricercatori più rispettati nel campo, di recente ha lasciato Tesla per entrare in Anthropic. Lavorerà sul pretraining, cioè sulla fase in cui i modelli imparano da zero. Ma la cosa interessante non è il trasferimento, è il vocabolario con cui descrive il suo lavoro. Lo chiama "vibe coding". Una traduzione approssimativa sarebbe "programmare a sensazione". Karpathy non scrive più riga per riga. Tiene aperto un modello accanto a sé e lo lascia completare la sua intuizione architetturale, mentre lui guida con il polso del mestiere.

Dall'altra parte dell'oceano, e dall'altra parte politicamente, c'è David Heinemeier Hansson, l'inventore di Ruby on Rails. Per anni ha avuto un'opinione molto fredda sull'AI applicata al codice. Adesso ha cambiato idea, ma con stile. Tiene aperto un terminale con due modelli che girano in parallelo, uno veloce e uno preciso. Li lascia lavorare, poi rivede. Quello che merita di entrare nel codice vero, lo fa entrare. Il resto no. Lo racconta in un'intervista con la Pragmatic Engineer, e ha il tono di chi ha trovato un assistente bravo, non un sostituto.

Simon Willison, che è uno dei divulgatori più onesti di questo mondo, dice una cosa che vale la pena tenere a mente. Per anni l'asticella era la perfezione del codice. Adesso, scrive, l'asticella è un'altra. Meglio un prodotto messo in piedi in due settimane e davvero usato, che un progetto perfetto che non vede mai la luce. Da duecento righe al giorno è passato a duemila. Ma la cosa importante non è il numero, è il cambio di metrica.

Ecco il primo filo della giornata. Tre persone molto diverse — un ricercatore puro, un imprenditore polemico, un divulgatore pragmatico — stanno convergendo sullo stesso gesto. L'AI non sostituisce, completa. Non scrive il pezzo al posto tuo, ti tiene la penna ferma mentre pensi al periodo dopo. È una distinzione sottile, ma sposta tutto.

Per capire perché conta, vale la pena guardare indietro di qualche decennio. Quando l'elettricità è entrata nelle fabbriche, all'inizio dell'Ottocento, è stata usata male per parecchio tempo. Si prendeva la vecchia fabbrica a vapore, si toglieva la caldaia, si metteva un motore elettrico al posto suo, e tutto restava com'era. Cinghie, alberi, ingranaggi. Ci sono voluti quarant'anni perché qualcuno capisse che con l'elettricità si poteva ripensare il pavimento della fabbrica, mettere un motore piccolo dove serviva, e fare cose che col vapore non si potevano fare. Quello che succede oggi con il codice assomiglia a quel passaggio. Non si tratta di mettere un'AI accanto al programmatore. Si tratta di capire che il pavimento della fabbrica può essere rifatto.

Mentre tutto questo accade, c'è una seconda voce che arriva da un altro angolo. Nat Friedman, che è uno degli investitori più ascoltati di Silicon Valley, dice qualcosa che spiazza. Il vero limite, nota in una conversazione con Ben Thompson, non è il calcolo. Non sono le GPU. I dati ci sono, i modelli ci sono, le fabbriche di calcolo grandi come città ci sono. Quello che manca è la capacità di tradurre tutto questo in qualcosa di usabile da una persona normale. Il collo di bottiglia, dice, è l'interfaccia. Cioè è il mestiere, di nuovo. È sapere cosa fare con questa potenza.

E qui si apre un piccolo paradosso che Patrick Collison, il fondatore di Stripe, descrive bene. Più le macchine automatizzano il come, più diventa decisivo il cosa. Più diventa importante avere qualcuno che decide cosa vale la pena costruire. Stripe vede, dai suoi dati di pagamento, un aumento quasi verticale di nuove aziende in queste settimane. Persone che usano gli agenti AI per partire. Ma la differenza tra quelle che dureranno e quelle che spariranno, dice Collison, non sarà la potenza dei loro modelli. Sarà il giudizio di chi le ha messe in piedi.

Tre voci, tre angolazioni, una sola intuizione. Stiamo entrando in una fase in cui l'AI è abbondante, e il bene scarso è diventato la testa di chi la guida.


Andrej Karpathy è il personaggio da cui conviene partire, perché incarna meglio degli altri questo cambio di stagione. Per anni l'abbiamo visto associato a Tesla, alla visione delle auto che imparano a guidare guardando il mondo. Prima ancora era a OpenAI. Una settimana fa ha annunciato che si sposta da Anthropic, per occuparsi di pretraining. Tradotto in parole semplici: vuole capire come insegnare a una rete neurale a imparare meglio, fin dall'inizio.

Quello che lo rende un personaggio interessante non è il curriculum, sono i piccoli gesti pubblici. Tiene un repository su GitHub che si chiama nanochat, ed è una specie di kit minimo per costruirsi un modello tipo GPT-2 in un paio d'ore, su otto schede grafiche. È un manifesto. Sta dicendo: non serve essere un colosso per fare ricerca seria. Una persona, un piccolo team, basta.

Poi ha pubblicato un altro repository, autoresearch, seicento righe di codice in tutto. È un agente che fa ricerca. Una persona sola, in un fine settimana, può scriverne uno simile. Karpathy lo presenta non come un trofeo, ma come un esempio della tesi che porta avanti da mesi: il file di idee, la pagina di appunti scritti bene, oggi è una forma di distribuzione. Un buon prompt diventa un piccolo software.

E poi c'è il pezzo più curioso. Karpathy invita la gente a costruirsi una "wiki di LLM" personale dentro Obsidian, che è quel programma di appunti con i collegamenti tra una nota e l'altra. La sua idea è semplice. Invece di affidarsi alla memoria opaca degli assistenti commerciali, che ricordano per noi senza farci vedere come, costruisci la tua memoria a vista. Note, link, articoli che si rimandano. Una specie di enciclopedia personale che l'AI ti aiuta a popolare ma che resta tua.

Tutto questo si tiene insieme. Karpathy non sta inseguendo il modello più grande. Sta cercando di disegnare un modo di lavorare in cui la persona resta al centro e l'AI è un'amplificazione, non una sostituzione. È quello che intende quando parla di vibe coding. Non è una scorciatoia, è una postura. Lasciare che la macchina riempia i vuoti, ma tenere ferma l'intuizione su dove si vuole andare.

Quello che mi sembra notevole è che Karpathy potrebbe permettersi di fare tutto il contrario. Potrebbe predicare il modello da mille miliardi di parametri, la corsa al calcolo. Invece dice: fate cose piccole, leggibili, vostre. È un suggerimento che arriva da un posto strano, da uno che ha lavorato dentro le aziende più grandi del settore. E forse proprio per questo va ascoltato.


Spostiamoci su David Heinemeier Hansson, che chiameremo DHH come fanno tutti. È danese, vive in Spagna, da vent'anni gestisce una piccola azienda di software che si chiama 37signals. Ha creato Ruby on Rails, uno strumento che ha fatto nascere migliaia di startup negli anni Duemila. Ha sempre avuto opinioni controcorrente, e questa primavera ha portato a termine due cose che gli somigliano molto.

La prima: è uscito da Amazon Web Services. Cioè ha smesso di affittare i server della grande nuvola e ha comprato hardware suo, lo ha messo in qualche data center, e ci fa girare i suoi prodotti. Risparmia, dice, circa quattro milioni di dollari l'anno. La sua tesi è semplice e provocatoria: il cloud è stato venduto come una rivoluzione, ma per molte aziende di dimensioni medie è solo un affitto caro. Ha ragione lui? Ha torto? Dipende dai casi. Ma il gesto pubblico conta. Una generazione di sviluppatori si è abituata a pensare che mettere un server in una stanza fosse roba da dinosauri. DHH dice il contrario, e mostra i conti.

La seconda cosa è il cambio di rotta sull'AI. Per anni è stato scettico. Adesso ha trovato un equilibrio. Usa due modelli in parallelo, dentro una finestra di terminale. Uno veloce, Gemini, per il lavoro grezzo. Uno più preciso, Opus di Anthropic, quando serve qualità. Li lascia produrre, poi sceglie cosa tenere. Lo standard, dice, è quello di sempre. Se un pezzo di codice non merita di entrare nel progetto come lo avrebbe scritto un bravo programmatore, fuori. Niente sconti.

Quello che mi colpisce è il filo che tiene insieme i due gesti. Sia l'uscita dal cloud sia l'uso pacato dell'AI raccontano la stessa cosa. Una piccola azienda può essere padrona dei suoi strumenti. Non deve dipendere dalle grandi piattaforme. Può comprare i suoi server, può scegliere quale modello usare, può tenere un team minuscolo. Lui parla di una decina di designer e una ventina di programmatori. In un mondo dove le valutazioni delle startup si misurano in miliardi, lui rivendica la dimensione di artigiano.

C'è un dettaglio che vale la pena notare. DHH sta anche sviluppando una distribuzione di Linux che si chiama Omarchy, pensata per chi viene da Mac o da Windows. È un altro tassello dello stesso disegno. Più cose tieni in casa tua, più hai voce in capitolo su come funzionano. Per chi ci ascolta in macchina può sembrare una questione settoriale, ma è la stessa che si pone una piccola impresa quando decide se affidare la contabilità a un servizio esterno o tenersi un commercialista di fiducia.

Ricapitoliamo un attimo dove siamo, perché il filo è importante. Karpathy dice: l'AI mi serve come amplificatore della mia testa. DHH dice: l'AI mi serve come ottimo collaboratore, ma il controllo lo tengo io. Sono due varianti della stessa idea, e suggeriscono che la stagione dell'AI come sostituzione magica del lavoro umano sta perdendo terreno, almeno tra le persone che davvero ci lavorano dentro.


John Carmack è una figura particolare. Negli anni Novanta ha scritto i motori grafici dei videogiochi che hanno definito un'epoca, Doom, Quake. Poi ha lavorato sui visori di realtà virtuale di Meta. Tre anni fa ha lasciato e ha fondato una piccola società che si chiama Keen Technologies, con un obiettivo dichiarato: capire come si costruisce un'intelligenza generale.

In un'intervista di questa primavera dice qualcosa che spiazza, viste le voci che girano intorno a lui. "Non siamo sull'orlo dell'AGI". Cioè non siamo a un passo dall'intelligenza artificiale generale, quella che dovrebbe ragionare come una persona. Mette una scadenza prudente: 2030, e con una probabilità intorno al cinquanta, sessanta per cento. Non zero, ma neanche imminente.

La cosa interessante è come Keen Technologies lavora. Carmack non sta addestrando modelli giganteschi. Sta facendo qualcosa di molto più antico nello spirito. Mette dei robot dentro stanze, gli dà una telecamera, e li lascia imparare a giocare con i vecchi giochi Atari muovendo un joystick vero, con un braccio meccanico. È un ritorno alla scuola del fare. L'intelligenza, dice lui, non viene dalla lettura di tutto il testo del mondo. Viene dal contatto con il mondo stesso.

È una posizione contro corrente, ma ha un suo peso. Dice in sostanza che la corsa al modello più grande, da sola, non ci porta dove pensiamo. Manca un pezzo: la capacità di capire causa ed effetto. Una rete che ha visto miliardi di parole può imitare il linguaggio del ragionamento, ma non per forza ragiona. Un bambino che fa cadere un cucchiaio dal seggiolone, dice in fondo Carmack, sta facendo scienza. Una rete neurale che ha letto un trattato di fisica non sta facendo niente di simile.

In una battuta che ha fatto il giro, dice che il codice per un'AGI vera potrebbe essere scritto, in linea di principio, da una singola persona. Non è uno slogan da hacker. È una scommessa filosofica. Se ci arriveremo, ci arriveremo grazie a un'idea, non grazie a un capannone di chip. Per ora la sua azienda ha raccolto venti milioni di dollari, ha un team piccolissimo, e nessuna fretta di vendere prodotti.

Quello che lega Carmack al resto della giornata è una linea sottile. Anche lui, a modo suo, sta dicendo che il problema non è la scala. È capire cosa stiamo facendo. Lo dice da un altro lato della trincea — non quello del programmatore che usa l'AI nel suo terminale, ma quello del ricercatore che si chiede cosa manca al cuore della macchina. E però l'umore di fondo è lo stesso. Frenare un attimo. Pensare bene.


L'ultima voce che vale la pena ascoltare è quella di Demis Hassabis, che guida DeepMind dentro Google. Una settimana fa è andato a Seoul. Ha incontrato il presidente della Corea del Sud. E ha rivisto Lee Sedol, il campione di go che la sua macchina AlphaGo aveva battuto undici anni fa, in una partita che rimane nella storia.

Il gesto è stato letto in molti modi, ma quello che Hassabis ha detto è semplice. I costruttori dell'AI non possono venire tutti da venti chilometri quadrati di San Francisco. Quando una tecnologia così importante nasce in un solo posto, finisce per parlare la lingua di quel solo posto. È un'osservazione che vale per la nostra epoca quanto vale, andando indietro, per il momento in cui la stampa a caratteri mobili è nata a Magonza e ha cambiato un continente intero perché ha incontrato lingue, scuole, mercati diversi.

Hassabis fissa la sua stima di un'intelligenza generale entro il 2030 al cinquanta per cento. Né apocalittico né indifferente. E aggiunge una cosa importante. I limiti veri non sono nei chip, sono in tre buchi concettuali che la ricerca non ha ancora chiuso. Imparare in continuazione senza dimenticare. Tenere una memoria stabile nel tempo. Ragionare guardando sé stessi. Sono problemi che nessuna quantità di GPU risolverà da sola.

C'è un pezzo della sua intervista che resta in testa. Dice che sente un fastidio in fondo alla testa per il modo in cui la corsa commerciale e il dovere scientifico globale stanno andando in direzioni diverse. Non risolve la cosa con una formula. La dice come un disagio. È raro sentire una frase così onesta da chi guida il laboratorio più finanziato del settore.

In sottofondo c'è un terzo personaggio della settimana che merita un cenno, Ilya Sutskever. Ha fondato un'azienda che si chiama Safe Superintelligence, dice una cosa parente di quella di Carmack. La fase dello scaling, cioè del fare modelli sempre più grandi, ha tirato fuori tutta l'aria dalla stanza. I dati per addestrarli stanno finendo. Serve un altro paradigma. Sutskever immagina, in modo poetico, una macchina che impara come un quindicenne. Poca conoscenza iniziale, ma una straordinaria capacità di apprendere stando al mondo.

Tutte queste voci, che vengono da posti diversissimi, stanno cantando la stessa nota. La scala non basta più.


Vale la pena chiudere con uno sguardo a qualche progetto che racconta questa stagione meglio di mille analisi. Sono piccoli pezzi di software che, presi insieme, danno l'idea di dove sta andando il vento.

Il primo è nanochat, di cui abbiamo già parlato, il kit di Karpathy per addestrarsi un modello tipo GPT-2 a casa. Non è un giocattolo nostalgico. È un messaggio. Si può fare ricerca seria senza essere un colosso.

Il secondo è llama.cpp, un motore che permette di far girare modelli linguistici sul proprio computer, senza passare dal cloud. Vitalik Buterin, di cui non abbiamo parlato oggi ma che vale la pena nominare, lo ha messo al centro della sua proposta di uno stack autonomo, dove ognuno tiene a casa propria sia i dati sia il calcolo. È il corrispondente digitale del coltivare l'orto.

Il terzo è Omarchy, la distribuzione Linux di DHH. Pensata per chi viene da Mac, pensata per essere bella e modificabile. È un piccolo manifesto culturale prima che tecnico. Dice che il desktop non è una cosa morta, che si può ancora avere un computer che ci somiglia.

Il quarto si chiama claude-context. È un servizio che permette ai modelli AI di leggere e capire un'intera base di codice come se fosse un libro a cui poter tornare. Sembra una cosa tecnica, ma è esattamente l'esempio di quello che dicevano Friedman ed Evans: il valore non è nel modello, è nel modo in cui glielo dai in pasto. Chi costruisce queste cucitura tra il modello e il lavoro reale, oggi, vince.

E poi c'è il lavoro di François Chollet su ARC, che è una specie di test di intelligenza disegnato per le macchine. Roba che un bambino risolve in pochi minuti, e che i modelli più grandi falliscono. Quest'anno il premio per chi riesce a risolverlo è di due milioni di dollari. Resta in piedi, intatto. È una promemoria silenzioso: c'è ancora molta strada.


Resta in mente, alla fine, l'immagine di Hassabis e Lee Sedol che si rivedono a Seoul, dopo undici anni dalla loro partita. Da un lato chi ha costruito una macchina che ha vinto. Dall'altro chi ha perso ma ha capito qualcosa. Forse il punto della giornata è tutto lì, in quella stretta di mano. Le macchine sono diventate brave. Adesso tocca a noi essere all'altezza. È stato Signal Brief. Alla prossima.