Hackera ChatGPT e Google in 20 minuti?

Tim Cook punta tutto sul "Visual Intelligence" per smart glasses e AirPods

Nell’edizione di oggi:

🇨🇳 Anthropic accusa tre lab cinesi di furto industriale su Claude 

💬 Google raddoppia le performance di ragionamento con Gemini 3.1 Pro

🏃‍♂️ Grok 4.20: quattro agenti che si sfidano in tempo reale per darti la risposta giusta

🧪 Hackera ChatGPT e Google in 20 minuti

🗞️ Le notizie

1/ 

Anthropic ha identificato campagne su scala industriale da parte di DeepSeek, Moonshot AI e MiniMax per estrarre illecitamente le capacità di Claude e migliorare i propri modelli. 

Le tre aziende hanno generato oltre 16 milioni di scambi attraverso circa 24.000 account fraudolenti, in violazione dei termini di servizio e delle restrizioni di accesso regionali. 

La tecnica usata si chiama "distillation": si addestra un modello meno capace sugli output di uno più potente, legittima in sé, ma qui usata per sottrarre capacità in una frazione del tempo e del costo necessari a svilupparle autonomamente. 

MiniMax da sola ha generato 13 milioni di scambi, e quando Anthropic ha rilasciato un nuovo modello durante la campagna attiva, l'azienda ha reindirizzando metà del traffico sul nuovo sistema in appena 24 ore. 

Anthropic avverte che i modelli distillati illecitamente perdono i paletti di sicurezza originali, aprendo la porta all'uso militare, di sorveglianza e offensivo da parte di governi autoritari.

2/ 

Sul benchmark ARC-AGI-2, che valuta la capacità di risolvere pattern logici completamente nuovi, il modello ha ottenuto un punteggio verificato del 77.1%, più del doppio rispetto a Gemini 3 Pro. 

Il modello è già accessibile su Gemini API, AI Studio, Vertex AI, NotebookLM e Android Studio, con limiti più alti per gli abbonati ai piani Google AI Pro e Ultra

3/ 

xAI ha rilasciato Grok 4.20 in beta pubblica, un salto di sviluppo rispetto ai modelli precedenti: non più un singolo modello, ma quattro agenti specializzati che collaborano, si confrontano e si correggono a vicenda in tempo reale. 

I quattro agenti hanno ruoli distinti, Grok coordina e sintetizza, Harper gestisce ricerca e fact-checking, Benjamin ragionamento logico e codice, Lucas sintesi creativa, e lavorano in parallelo dibattendo i dettagli prima di produrre la risposta finale. 

Il risultato pratico: le allucinazioni si riducono dal 12% al 4.2%, un miglioramento del 65% rispetto ai modelli precedenti. 

Prima ancora del lancio ufficiale, Grok 4.20 ha partecipato in forma anonima come "Mystery Model" alla competizione Alpha Arena Season 1.5, ottenendo un +12.11% di ritorno in due settimane di trading azionario reale con $10.000 di capitale, l'unico modello profittevole, mentre GPT-5.1 e Gemini 3 Pro hanno registrato perdite significative. 

🤑 Il finanziamento della settimana

Fondata da imprenditori fintech seriali, Jump sviluppa una piattaforma AI che automatizza le attività operative dei consulenti finanziari.

Prende appunti durante le riunioni con i clienti, genera report e follow-up, aggiorna il CRM, prepara documentazione e supporta i flussi di lavoro quotidiani.

La soluzione consente di risparmiare da una a due ore al giorno per advisor ed è già utilizzata da 27.000 consulenti, supportando società che gestiscono circa $12 trilioni di asset.

I fondi saranno utilizzati per accelerare lo sviluppo del prodotto e ampliare le funzionalità AI per il wealth management.

🧠 Varie dal mondo dell’AI

📸 L’immagine della settimana

Per il suo 90° compleanno, il nipote gli regala l’intera vita “animata”

⚒️ Risorse utili

Un unico luogo, tutti i tool di cui hai bisogno. (link)

🔮 I tool della settimana

Koah: Monetizza la tua app con le “esperienze sponsorizzate”

Figr: Un’AI consapevole del prodotto che pensa anche all’esperienza utente

Hugo: Risolvi i ticket più velocemente, riduci il carico di lavoro e automatizza le attività ripetitive

Pietro Fiore - Esperto AI e founder.

Come hai trovato la newsletter di oggi?

I tuoi feedback mi aiutano a migliorare!

Login o Iscriviti per partecipare ai sondaggi.