Come funzionano i rilevatori di contenuti AI
Molti strumenti promettono di essere in grado di distinguere i contenuti generati dall'IA da quelli scritti dall'uomo, ma finora ho dubitato che funzionassero davvero. Riconoscere i contenuti generati dall'intelligenza artificiale è molto più difficile che riconoscere i contenuti vecchi, "centrifugati" o plagiati. La maggior parte dei testi generati dall'IA può essere considerata in qualche modo originale, non semplicemente copiata da Internet.
Tuttavia, poiché in Ahrefs stiamo costruendo un rilevatore di contenuti AI, ho approfondito l'argomento. Per capire come funzionano questi strumenti, ho intervistato un esperto che conosce bene la scienza e la ricerca che vi sta dietro.
Come funzionano i rilevatori di contenuti AI?
Tutti i rilevatori di contenuti dell'intelligenza artificiale funzionano secondo lo stesso principio di base: cercano modelli o anomalie nel testo che differiscono dal contenuto scritto dall'uomo. Ciò richiede due cose: molti esempi di testo generato dall'uomo e dall'IA e un modello matematico per l'analisi.
Esistono tre approcci comuni:
1. Rilevamento statistico (metodo tradizionale ma efficace)
I tentativi di riconoscere la generazione di testo da parte delle macchine esistono dagli anni 2000. Questi vecchi metodi possono funzionare bene ancora oggi. I metodi di rilevamento statistico distinguono il testo scritto dall'uomo da quello generato dalla macchina contando i modelli di scrittura.
- Frequenza delle parole (la frequenza con cui compaiono determinate parole)
- Frequenze degli N-grammi (la frequenza di determinate sequenze di parole)
- Strutture sintattiche (ad es. frequenza di strutture soggetto-oggetto-oggetto)
- Sottigliezze stilistiche (ad esempio, uso della prima persona, stile informale, ecc.)
2. Reti neurali (moderni metodi di apprendimento profondo)
Le reti neurali sono sistemi informatici che imitano vagamente il funzionamento del cervello umano. Queste reti sono in grado di riconoscere e imparare ciò che distingue i testi generati dall'intelligenza artificiale.
Questi metodi possono funzionare efficacemente anche con modelli più piccoli, a condizione che dispongano di dati sufficienti per addestrarli (qualche migliaio di esempi può essere sufficiente).
3. Filigrana (simboli nascosti nei testi generati)
Lo scopo del watermarking è quello di consentire al testo generato dall'intelligenza artificiale di contenere segnali nascosti che identifichino che il contenuto è stato generato dalla macchina. È simile all'inchiostro UV delle banconote, che distingue il denaro autentico da quello contraffatto.
La filigrana può essere applicata in tre modi:
- Aggiungere filigrane ai set di dati prodotti.
- Includere filigrane quando si genera il testo.
- Aggiungere filigrane dopo la generazione del testo.
Sintesi
I rilevatori di contenuti AI possono essere strumenti utili, ma hanno anche dei limiti. Per ottenere i risultati giusti, è importante conoscere le capacità e i limiti degli strumenti ed essere sempre critici nei confronti dei risultati che producono.
