
[ Metodo ]
10 min
Il framework 4D: Delegation, Description, Discernment, Diligence
Quattro abitudini che trasformano chi usa l'AI da "prova e spera" a professionista che sa quando fidarsi, quando verificare, quando fermarsi.
Leggi
[ METODO ]
La terza D del framework Anthropic. Sette tipi di allucinazione, tre lenti operative, l'abitudine più difficile da insegnare.
[ Framework ] · 9 minuti di lettura · pubblicato il
Discernment è la D più difficile del framework 4D di Anthropic. Un modello generativo produce testo plausibile anche quando inventa. Plausibile non vuol dire vero. Imparare a leggere l'output di un LLM con l'occhio del professionista — non quello del lettore distratto — è una competenza che si costruisce in mesi di pratica, non in un'ora. Questo articolo è la mappa che usiamo per insegnarla.
Discernment è anche la D che fa la differenza fra un uso amatoriale dell'AI e un uso professionale. Le persone che la sviluppano bene smettono di stupirsi di quello che il modello fa giusto: si concentrano su dove tipicamente sbaglia, e leggono ogni output con quella griglia in mente. È quello che vi proponiamo qui.
Un modello generativo non «sa» cose nel senso in cui un umano le sa. Produce sequenze di parole che hanno alta probabilità di essere coerenti con il prompt e con tutto quello che ha visto in addestramento. Quando le parole più probabili corrispondono a qualcosa di vero, otteniamo una risposta corretta. Quando non corrispondono, otteniamo un'allucinazione: una sequenza che sembra vera, suona bene, è grammaticalmente impeccabile, ma è falsa.
Tre cose importanti da fissare:
Dopo tre anni di feedback dai nostri programmi, abbiamo distillato sette tipologie ricorrenti. Riconoscerle a colpo d'occhio è l'abitudine che salva il vostro nome.
Il modello inventa riferimenti bibliografici, sentenze, articoli accademici, libri. La sintassi è perfetta — autore, titolo, anno, editore, pagine. La fonte non esiste, oppure esiste ma dice un'altra cosa. È la tipologia più documentata in letteratura (caso celebre: nel 2023 un avvocato di New York fu sanzionato per aver citato sentenze inventate da ChatGPT in una memoria depositata).
Come riconoscerla: ogni volta che il modello fornisce una citazione, controllatela. Se è un libro, cercatelo su un catalogo di biblioteca. Se è una sentenza, cercatela sull'archivio del tribunale. Se è un articolo accademico, cercatelo su Google Scholar. Sembra paranoia. Non lo è.
Statistiche, percentuali, dati finanziari, prezzi, popolazione, anni. Il modello produce numeri che sembrano plausibili in relazione al contesto ma sono inventati, o veri ma per un anno diverso, o relativi a un altro paese che ha un nome simile.
Come riconoscerla: per ogni numero che lasciate passare in un documento pubblico, dovete avere una fonte. Una regola che applichiamo: nessun numero non verificato esce dal nostro studio.
Articoli di legge citati con numero sbagliato, regolamenti attribuiti all'anno errato, decreti che non sono mai stati adottati, sentenze datate con anno improbabile. Particolarmente rischioso nel dominio svizzero perché le norme cantonali, federali ed europee si intrecciano e il modello, addestrato prevalentemente su materiale anglofono, tende a applicare schemi statunitensi a situazioni svizzere.
Come riconoscerla: ogni riferimento normativo specifico va verificato su admin.ch (per la Svizzera) o EUR-Lex (per l'UE). Le regole generali («la nLPD impone un'informativa…») sono di solito affidabili; i riferimenti puntuali («articolo 17 paragrafo 3…») no.
Il modello riassume un testo lungo e, nel farlo, sostituisce un'affermazione cauta del testo originale con una sua versione più assertiva. «Potrebbe» diventa «è». «Alcuni autori sostengono» diventa «è dimostrato che». Il messaggio finale ha un grado di certezza che il testo originale non aveva.
Come riconoscerla: nelle sintesi, prestate attenzione ai modali (potrebbe, dovrebbe, può) e alle attribuzioni. Quando una sintesi suona più sicura del testo originale, è sospetta. Spot-check a campione su tre o quattro passaggi del documento di partenza.
Il modello sviluppa coerentemente un'argomentazione, ma la premessa di partenza è errata. Tutto quello che segue è logicamente impeccabile e fattualmente sbagliato. È la tipologia più subdola perché il lettore si concentra sul ragionamento — che fila — e non sulla base.
Come riconoscerla: leggete «all'indietro». Partite dalla conclusione e risalite alle premesse. Verificate che ogni premessa sia vera prima di accettare il filo del discorso. È un'abitudine controintuitiva ma molto efficace.
Spesso il problema non è quello che il modello scrive, ma quello che non scrive. Una valutazione di rischio che non menziona la categoria principale. Una sintesi che salta il paragrafo decisivo. Una proposta che omette il vincolo legale. Una comparazione di opzioni che dimentica l'opzione che il cliente ha esplicitamente chiesto di considerare.
Come riconoscerla: ponetevi sempre la domanda — cosa mancherebbe in questo documento se fosse l'unico che il decisore legge? Le omissioni si vedono solo se le cercate.
I modelli generativi sono mediamente più sicuri quando dovrebbero essere meno sicuri. Quando si chiede qualcosa che è genuinamente incerto (una previsione, una stima, un argomento controverso), il modello tende a fornire una risposta netta dove un esperto risponderebbe con «dipende».
Come riconoscerla: ogni volta che chiedete qualcosa di previsionale o speculativo e ricevete un' affermazione assertiva, attivate il sospetto. Aggiungete come riflesso: «Quali sono i limiti della tua risposta? Cosa cambierebbe se le mie assunzioni fossero diverse?» — il modello, sollecitato, articola l'incertezza che aveva smussato.
Una volta interiorizzate le sette tipologie, l'abitudine operativa è applicare tre lenti rapide a ogni output sostantivo. Tre passaggi, due minuti per testo medio.
Scorrere il documento cercando esplicitamente: citazioni, riferimenti, sentenze, numeri, statistiche, date. Per ciascuno, domandarsi: posso risalire alla fonte primaria?Se sì, farlo (o annotare per farlo dopo, se è una bozza intermedia). Se no, marcare come «da verificare».
Identificare la conclusione principale e la premessa più importante. Domandarsi: la premessa è vera? Il salto fra premessa e conclusione regge? Spesso il modello fa salti plausibili ma logicamente fragili — un buon Discernment li ferma.
Chiudere il documento e riaprirlo dopo trenta secondi. Domandarsi: cosa mi aspettavo di trovare e non c'è? Tre o quattro lacune comuni: un rischio che si vede a occhio, una controparte che andava menzionata, un vincolo che cambia il quadro. Le omissioni si vedono solo con questo gesto di stacco.
Un'abitudine che insegniamo nei nostri programmi e che molti sottovalutano: chiedere al modello di criticare il proprio output. Funziona meglio di quanto sembri. Tre pattern.
Dopo aver ottenuto un output, in una seconda richiesta: «Adesso fai finta di essere un avvocato esperto in contrattualistica svizzera. Leggi la risposta che hai appena dato e segnala due cose che andrebbero verificate prima di farla uscire dallo studio.» Il modello, nei panni del verificatore, spesso individua le sue stesse debolezze.
Per output con dati: «Elenca tutti i numeri citati nella tua risposta. Per ciascuno, indica se l'hai dedotto dal contesto che ti ho fornito, se è di tua memoria, o se è una stima. Etichetta espressamente.» I numeri etichettati come «di memoria» o «stima» sono quelli da verificare per primi.
«Quali tre informazioni avresti voluto avere per fare una risposta migliore? Cosa hai dovuto assumere?» Spesso il modello rivela vincoli che vi era mancato di fornire — e che, una volta forniti, migliorano radicalmente la qualità della seconda iterazione.
Una verità scomoda: Discernment non si impara leggendo. Si impara facendo, su casi reali, e con qualcuno che faccia notare quello che si è perso. Per questo la sessione Discernment nei nostri programmi è di solito la quarta o quinta — viene dopo il consolidamento di Delegation e Description — e si articola in tre tappe distribuite su sei settimane:
Dopo questo percorso, le persone smettono di stupirsi quando trovano un'allucinazione. Inizia a sembrare normale — un'attività di routine, non un'eccezione. È il segno che Discernment è entrato nel mestiere.
Tre conseguenze tipiche del lavorare con l'AI senza Discernment maturo:
Discernment è la capacità di vedere gli errori. Diligence è l'abitudine di sistematizzare la verifica perché non dipenda dalla giornata. Una checklist personale per ogni tipologia di output che producete con l'AI — diversa per email, diversa per documenti tecnici, diversa per atti. Diligence è la quarta D e ne parliamo in Diligence — il ciclo di verifica che protegge il vostro lavoro. È il sigillo finale del framework 4D.
[ FAQ ]
È un output che sembra vero, suona bene, è grammaticalmente impeccabile, ma è falso. Non è un bug: è una caratteristica strutturale dei modelli generativi. Migliora con i modelli più recenti ma non sparisce. Le allucinazioni si concentrano in tipologie prevedibili — citazioni inventate, numeri sbagliati, riferimenti normativi storpiati, sintesi che cambiano premesse — e riconoscerle a colpo d'occhio è metà del lavoro di Discernment.
[ CORRELATE ]

[ Metodo ]
10 min
Quattro abitudini che trasformano chi usa l'AI da "prova e spera" a professionista che sa quando fidarsi, quando verificare, quando fermarsi.
Leggi
[ Metodo ]
10 min
La seconda D del framework Anthropic. Quattro ingredienti, dieci pattern riutilizzabili, tre antipattern da evitare.
Leggi
[ Metodo ]
9 min
La quarta D del framework Anthropic. Costruire la checklist personale, applicarla anche quando si ha fretta, evolverla nel tempo.
Leggi[ FORMAZIONE ]
Quindici minuti di conversazione bastano per capire se possiamo essere utili. Non è una call di vendita — è il primo ascolto.