Google ha introdotto una nuova funzionalità che salva automaticamente ogni media caricato durante le ricerche per addestrare i propri modelli di intelligenza artificiale. Immagini caricate per la ricerca inversa, audio di conversazioni con Google Traduttore e file multimediali simili vengono ora conservati nella Cronologia dei servizi di Ricerca, una sezione dell'account che molti utenti hanno trovato già attiva al primo accesso. Questo cambiamento, annunciato via email il 23 giugno, offre agli utenti un maggiore controllo sui dati salvati, ma solleva interrogativi sulla privacy e sull'onere di dover disattivare manualmente l'opzione.
Una raccolta dati estesa e automatica
La nuova impostazione amplia notevolmente la quantità di dati che Google conserva dalle interazioni con i propri servizi. Non si tratta più solo di testo digitato, ma di immagini, file, registrazioni audio e video. Tra questi rientrano le foto scattate con Google Lens, le ricerche vocali, i contenuti caricati durante l'utilizzo di Search Live o le esercitazioni di pronuncia in Google Traduttore. Google afferma che questi dati aiutano a fornire risultati più pertinenti e a migliorare la qualità delle ricerche visive e vocali. Tuttavia, la stessa documentazione di Google specifica che i media salvati possono essere utilizzati per l'addestramento dei modelli di IA, con un periodo di conservazione fino a quattro anni anche dopo l'eliminazione dell'attività originale.
Sponsored Protocol
Come disattivare la cronologia dei servizi di ricerca
Per disattivare questa funzionalità, gli utenti devono visitare la pagina My Activity di Google e selezionare la scheda Cronologia dei servizi di ricerca. Qui è possibile disattivare l'intera impostazione e cancellare l'attività accumulata. Il passaggio cruciale è deselezionare la casella Salva media, altrimenti i caricamenti continueranno a essere conservati per l'addestramento dell'IA. Google stessa avverte che, una volta che i media vengono utilizzati per l'addestramento, vengono disconnessi dall'account e conservati fino a quattro anni, anche se l'attività originale viene cancellata. È quindi consigliabile agire immediatamente per evitare che i propri dati entrino nel ciclo di apprendimento automatico.
Sponsored Protocol
Il dibattito sulla privacy e l'onere dell'opt-out
La decisione di Google di attivare questa funzionalità per impostazione predefinita è stata criticata dagli esperti di privacy. Thorin Klosowski, senior security and privacy activist presso l'Electronic Frontier Foundation, sottolinea che Google si trova in una posizione unica grazie all'ampia gamma di servizi che gli utenti utilizzano quotidianamente, creando una sorta di inerzia che rende difficile passare ad alternative. Anche Ben Winters, direttore AI e privacy della Consumer Federation of America, evidenzia che questo cambiamento impone un calcolo extra ai consumatori, che devono decidere se sentirsi a proprio agio nell'usare uno strumento che hanno utilizzato per anni. Mentre aziende come OpenAI aggiornano i propri modelli per ridurre le allucinazioni, Google punta su una raccolta dati più massiva. Nonostante le paure sull'impatto dell'IA, i dati SignalFire mostrano un aumento degli ingegneri, ma la questione della privacy resta centrale.
Sponsored Protocol
Una finestra temporale di quattro anni per i dati
Uno degli aspetti più preoccupanti è la durata della conservazione dei dati per l'addestramento. Anche se un utente decide di eliminare la propria attività, i media già utilizzati per l'addestramento rimangono nel sistema fino a quattro anni. Questo significa che una singola immagine caricata per una ricerca inversa potrebbe influenzare i modelli di IA di Google per anni, senza possibilità di rimozione. Per ulteriori dettagli sul funzionamento della ricerca, si può consultare la pagina di Wikipedia su Google Search.
Sponsored Protocol
In definitiva, la nuova funzionalità di Google rappresenta un ulteriore passo verso un utilizzo estensivo dei dati utente per l'addestramento dell'IA. Disattivarla è possibile, ma richiede un'azione consapevole da parte dell'utente, che deve districarsi tra le impostazioni dell'account. Come sottolineano gli esperti, la responsabilità non dovrebbe ricadere sempre sul consumatore, ma le aziende dovrebbero adottare modelli di opt-in trasparenti.
Fonte: https://www.wired.com/story/how-to-opt-out-of-google-search-new-ai-data-training