f in x
Index Coverage: pagine non indicizzate su Google — diagnosticare e risolvere tutti gli errori
> cd .. / HUB_EDITORIALE > Visualizza in Inglese
Seo e analitica

Index Coverage: pagine non indicizzate su Google — diagnosticare e risolvere tutti gli errori

[2026-06-12] Author: Ing. Calogero Bono

Il tuo sito ha 200 pagine, ma su Google ne trovi 40. O peggio: quelle importanti — schede prodotto, pagine servizio, articoli — non compaiono nemmeno nella ricerca. Il motivo? Errori di copertura nell'indice. Noi, di Meteora Web, vediamo quotidianamente clienti che perdono traffico e fatturato non perché il sito sia brutto, ma perché Google non è riuscito a indicizzare le pagine giuste. E la Search Console te lo dice chiaramente — se sai dove guardare. Questa guida ti spiega il report Index Coverage, errore per errore, con azioni concrete per risolverli. Non teoria: operatività.

Cos'è Index Coverage e perché non puoi ignorarlo

Index Coverage (Copertura dell'indice) è il report in Google Search Console che mostra quali pagine del tuo sito Google ha indicizzato e quali no. Sembra banale, ma è il termometro della salute SEO. Se una pagina non è indicizzata, per Google non esiste. Zero traffico, zero conversioni.

Il report ha quattro macro-categorie, ciascuna con sottostati:

  • Error — pagina non indicizzata per problemi bloccanti (es. 404, noindex, errore server)
  • Valid with warnings — pagina indicizzata ma con problemi che possono peggiorare (es. meta description mancante, pagina alternativa con canonical errato)
  • Valid — pagina correttamente indicizzata
  • Excluded — pagina non indicizzata per scelta tua o del sistema (es. bloccata da robots.txt, canonical differente, paginate, contenuti duplicati)

La maggior parte delle PMI ignora la sezione Excluded, confidando che le pagine siano comunque nell'indice. Errore gravissimo: Excluded significa che Google non ha messo quella pagina nel suo archivio principale. Spesso è giusto (pagine di ricerca, filtri, tag), ma altrettanto spesso ci finiscono pagine importanti.

Noi partiamo sempre da una domanda: quante pagine stai pagando per farle esistere (hosting, sviluppo, contenuti) ma Google non le vede? È come affittare un negozio in una via senza passaggio pedonale.

Sponsored Protocol

Leggere il report Index Coverage: mappa degli errori

La schermata principale di Search Console mostra un grafico a barre. Clicca su una categoria per vederne i dettagli. Ogni riga ha:

  • Il motivo dell'errore o esclusione
  • Il numero di pagine interessate
  • Un esempio di URL (puoi cliccare per vedere la lista completa)

Attenzione: Search Console campiona i dati su migliaia di URL. Per siti con poche pagine vedi tutto; per grandi portali solo un campione. Ma è sufficiente per individuare pattern.

Errori bloccanti (Error)

Qui Google dice: ho provato a indicizzare, ma non ci sono riuscito per un problema serio. Devi risolverli subito.

  • 404 (Not Found) — la pagina restituisce 404. Colpa: link interni rotti, URL cambiati senza redirect, contenuti cancellati.
    Cosa fare: identifica gli URL che generano errore (Scarica il CSV dal report), verifica se devono esistere. Se sì, ricreali o metti un 301 verso la pagina più simile. Se no, lascia il 404 (ma meglio un 410).
  • 5xx server error — errore temporaneo del server (503, 500). Se persistente, il tuo hosting è inaffidabile o il sito ha bug.
    Cosa fare: controlla i log del server, testa con strumenti come Lighthouse per performance; se è un picco di traffico, scala le risorse.
  • Submitted URL blocked by robots.txt — hai bloccato nei robots.txt proprio l'URL che hai chiesto di indicizzare (via sitemap).
    Cosa fare: apri il file robots.txt e rimuovi la regola che blocca quella directory (es. Disallow: /downloads/). Poi richiedi l'indicizzazione dal report.
  • Submitted URL marked ‘noindex’ — hai un tag <meta name="robots" content="noindex"> o un'intestazione X-Robots-Tag: noindex su una pagina che hai inviato in sitemap. Contraddizione.
    Cosa fare: rimuovi il noindex oppure rimuovi l'URL dalla sitemap. Non puoi dire “indicizzami” e “non indicizzarmi” contemporaneamente.
  • Submitted URL has crawl anomaly — Google ha avuto un problema tecnico durante lo scan (timeout, redirect infiniti, risposta lenta).
    Cosa fare: usa lo strumento “Ispeziona URL” per testare la risposta. Controlla il redirect chain: non più di 3 hop, meglio 1 diretto. Verifica la velocità di caricamento (Lighthouse, PageSpeed Insights).

Escluse (Excluded) — le più fraintese

Qui Google ha scansionato la pagina ma ha deciso di non indicizzarla. Le cause sono molte, alcune giustificate, altre no.

Sponsored Protocol

  • Page with redirect — la pagina fa un redirect (301, 302, meta refresh). Google segue il redirect fino a destinazione, ma non indicizza la sorgente. Cosa fare: se la sorgente è importante, rimuovi il redirect e metti contenuto unico o canonical.
  • Duplicate without user-selected canonical — contenuti identici a un'altra pagina, senza specifica del canonical. Google sceglie quale versione indicizzare. Cosa fare: imposta il tag <link rel="canonical" href="…"> sulla versione preferita. Se il duplicato è voluto (es. parametri di tracking), usa rel="canonical" o blocca con robots.txt.
  • Blocked by robots.txt — escluso dal crawling. Cosa fare: se vuoi che sia indicizzata, sblocca. Altrimenti ok.
  • Blocked due to access forbidden (403) — pagina protetta da login o IP. Google non può entrare. Cosa fare: se deve essere pubblica, rimuovi la protezione per Googlebot (puoi usare un IP range dedicato).
  • Not found (404) — anche qui, ma in Excluded perché Google l'ha già trovata 404 e non ritenta. Cosa fare: come sopra per Error 404.
  • Crawled – currently not indexed — Google ha scansionato la pagina ma non l'ha messa nell'indice (perché di bassa qualità, contenuto sottile, o duplicato). È l'esclusione più frustrante. Cosa fare: migliora il contenuto (almeno 300 parole, unico, valore). Verifica che non sia cannibalizzata da altre pagine. Controlla la qualità dei backlink. Poi richiedi l'indicizzazione.
  • Discovered – currently not indexed — Google ha trovato la pagina (via sitemap o link) ma non l'ha ancora scansionata. Succede quando il crawl budget è limitato. Cosa fare: migliora internal linking verso quella pagina, rendila più importante (link da homepage, breadcrumb). Riduci pagine di basso valore. Puoi richiedere manualmente l'indicizzazione da Search Console (ma non abusare: 10-15 al giorno).
  • Alternate page with proper canonical — pagina indicata come alternativa a un'altra con lo stesso contenuto (es. versione stampa, AMP). È normale. Cosa fare: nulla, a meno che non sia una pagina principale erroneamente trattata come alternativa.

Come risolvere gli errori: procedure passo-passo

1. Scarica il report completo

Da Search Console, nel report Index Coverage, clicca su un errore e poi in alto a destra “Scarica” (CSV). Avrai l'elenco di tutti gli URL interessati. Noi creiamo sempre un file Excel per analizzare pattern. Attenzione: il giorno dopo il download il report già cambia, ma l'istantanea è utile per il primo intervento.

Sponsored Protocol

2. Prioritizza per impatto SEO

Non tutti gli errori sono uguali. Errori 404 su pagine con backlink esterni o su pagine di prodotto sono priorità assoluta. Esclusioni per “Crawled – currently not indexed” su articoli originali vanno risolte subito. Invece “Duplicate without canonical” su pagine di tag (es. /tag/rosso/) può aspettare, ma conviene gestirle con noindex per non sprecare crawl budget.

3. Correggi gli errori tecnici

Ecco una checklist che usiamo sui progetti dei nostri clienti:

  • ◻ Controlla robots.txt: assicurati di non bloccare pagine importanti. Usa lo strumento “Verifica robots.txt” di Search Console.
  • ◻ Configura i redirect 301 per ogni pagina 404 che deve esistere.
  • ◻ Rimuovi meta noindex da pagine che vuoi indicizzare. Attenzione: se una pagina ha noindex, Google non la indicizza mai. Non mischiare noindex e sitemap.
  • ◻ Imposta canonical corretti su pagine duplicate (es. con parametri UTM). Il canonical deve puntare alla versione originale.
  • ◻ Migliora la qualità dei contenuti per le pagine “Crawled – currently not indexed”: aggiungi testo originale, immagini con alt text, struttura heading (H1, H2).
  • ◻ Ottimizza il crawl budget: riduci il numero di pagine di basso valore (filtri, archivi vuoti) aggiungendo noindex o bloccando in robots.txt. Google ha un limite di pagine da scansionare per sito.
  • ◻ Aggiorna la sitemap XML: includi solo pagine canoniche, senza duplicati. Rimuovi quelle con noindex o errore.
  • ◻ Dopo ogni correzione, usa lo strumento “Convalida correzione” in Search Console per richiedere una nuova scansione.

4. Richiedere l'indicizzazione manuale

Dopo aver risolto un problema, puoi chiedere a Google di riconsiderare una pagina specifica con “Ispeziona URL” → “Richiedi indicizzazione”. Funziona solo se l'URL è accessibile e privo di errori. Non farlo per migliaia di pagine in una volta: 10-20 al giorno è un buon limite.

Sponsored Protocol

Un caso reale: come abbiamo recuperato 150 pagine perse

Un cliente e-commerce Sicilia con 5000 schede prodotto. Il report Index Coverage mostrava 400 pagine in “Crawled – currently not indexed”. Analizzando i dati, abbiamo scoperto che erano schede con poche righe di descrizione (copiate dal produttore) e nessuna immagine unica. Google le considerava “thin content”. Abbiamo riscritto le descrizioni (3-4 frasi originali per scheda, partendo da template), aggiunto foto originali e applicato velocità di caricamento. In 3 settimane, 300 di quelle pagine sono passate a “Valid”. Il traffico organico è aumentato del 18%. I contenuti di qualità battono sempre i trucchi SEO.

Errori comuni che continuiamo a vedere

  • Mantenere il noindex sulle pagine che vuoi indicizzare. Controlla sempre: in Search Console, Ispeziona URL → “È impedita l'indicizzazione”. Se dice “Sì”, hai un problema.
  • Ignorare la sezione Excluded. Pensare che “tanto Google troverà le mie pagine”. No. Se sono escluse per “Crawled – currently not indexed”, devi agire.
  • Usare lo stesso contenuto su più pagine senza canonical. Google indicizzerà una sola, spesso quella meno importante per te.
  • Non aggiornare la sitemap dopo modifiche. Google legge la sitemap per scoprire nuove pagine. Se non invii quelle nuove o se mantieni URL errati, perdi tempo prezioso di crawl.

Strumenti complementari

Oltre a Search Console, noi usiamo:

Sponsored Protocol

  • Ahrefs/Semrush (a pagamento) per vedere quali pagine hanno effettivamente traffico e backlink, incrociando con l'indice di Google.
  • Screaming Frog (gratuito per 500 URL) per scansionare il sito e confrontare i risultati con Search Console (es. trova 404 interni, redirect chain, duplicati).
  • Ispeziona URL di Search Console — lo strumento più sottovalutato: ti dice esattamente cosa Google vede su una singola pagina.

In sintesi — cosa fare adesso

  1. Apri Search Console → Index Coverage e guarda quanti errori ci sono. Se non hai mai guardato, preparati a sorprese.
  2. Scarica il CSV per ciascuna categoria (Error, Excluded, Valid with warnings).
  3. Risolvi i 404 e i noindex contraddittori prima di tutto. Sono i più dannosi.
  4. Per le pagine “Crawled – currently not indexed” migliora il contenuto e richiedi l'indicizzazione manuale.
  5. Imposta canonical su tutte le pagine duplicate o alternative.
  6. Controlla robots.txt e sitemap: non bloccare cose importanti.
  7. Utilizza lo strumento di convalida per ogni correzione.
  8. Monitora settimanalmente: Index Coverage cambia ogni giorno. Se il numero di errori non cala, qualcosa non funziona.

Se vuoi approfondire l'intero ecosistema di Search Console, leggi la nostra Guida Pillar a Google Search Console.

Ing. Calogero Bono

> AUTHOR_EXTRACTED

Ing. Calogero Bono

Ingegnere Informatico, co-fondatore di Meteora Web. Esperto in architetture software, sicurezza informatica e sviluppo sistemi scalabili.
[ Read Full Dossier ]

> METEORA_WEB // WEB AGENCY

Costruiamo la presenza digitale che la tua azienda merita.

Siti web, social, pubblicità online, e-commerce e hosting performante: ingegnerizzati con metodo da ingegneri informatici a Sciacca, per tutta Italia.

> MW_JOURNAL

> READ_ALL()