Guida completa per la gestione dei contenuti duplicati in Magento
Anche se in Magento non vengono create pagine uguali, il sito ecommerce conterrà pagine con contenuti duplicati
Google non può capire che tutti gli indirizzi URL dei prodotti duplicati, o contenuti duplicati, di Magento hanno come target la stessa pagina. Gli utenti vedranno la versione più pertinente (secondo Google) dell’URL del tuo sito web, ma non quella che tu preferisci far vedere;
Per questo motivo, rischierai di perdere le visite del crawler, nel momento in cui i robot di Google scoprono i contenuti duplicati, non eseguiranno la scansione del tuo nuovo contenuto.
Per capire meglio, prova ad accedere alla console Google Webmaster per visualizzare gli avvisi relativi ai contenuti duplicati. Esamina le metriche del crawler (Scansione -> Statistiche di scansione) per vedere quante pagine sono già state scansionate, e indicizzate. Quindi confronta le statistiche con la quantità di pagine reale.
Se il numero di quelle pagine sottoposte a scansione e indicizzate è molte volte superiore a quello reale, continua a leggere perchè probabilmente hai problemi di contenuti duplicati.
I contenuti duplicati più comuni di Magento
In Magento si possono verificare due tipologie di pagine duplicate, parziali e totali. I duplicati parziali si verificano quando una parte minima del contenuto o il suo layout sono unici, ad esempio variazioni dello stesso prodotto. I duplicati totali si verificano quando il contenuto di due o più pagine è identico. L’esempio più comune di duplicati completi in Magento è lo stesso prodotto in diverse categorie.
Analizziamo più nel dettaglio i duplicati parziali:
1. Ordinamento dei prodotti
Una funzione molto comoda, presente in tutti gli shop online, è quella di ordinamento. Gli utenti possono ordinare i prodotti del negozio rispetto il volume di vendita, dai più recenti, rispetto il prezzo, ecc. Inoltre, i risultati di una ricerca, possono essere visualizzati in pagine di 10?, 20?, 50? prodotti. Tutto bello, ma queste opzioni di ordinamento creano indirizzi URL con caratteri diversi (?, =, |):
http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc
Il problema emerge quando l’ordinamento delle pagine viene indicizzato e persino memorizzato nella cache da Google. Immagina quante pagine possono esistere! Migliaia! E i crawler di Google passano il tempo a indicizzarli mentre possono concentrare le loro risorse sull’indicizzazione di pagine più importanti del tuo sito: categorie, prodotti, ecc.
1.2. Come trovare le pagine di ordinamento del prodotto
Aprendo una qualsiasi pagina di categoria, o in un risultato di ricerca, avrai una serie di prodotti in griglia o lista. A questo punto puoi ordinarli, e vedere i parametri aggiunti all’URL dopo l’ordinamento (ad esempio, dir, sortby). Vai su Google e cerca il sito: miodominio.com inurl: dir
Molto probabilmente vedrai questo:
Al fine di visualizzare i risultati più pertinenti, sono state omesse alcune voci molto simili alle 9 già visualizzate.
Se vuoi, puoi ripetere la ricerca includendo i risultati omessi.
Basta fare clic sul link per includere i risultati omessi, e vedrai le pagine nel tuo negozio contenenti “dir” negli URL. Non è molto bello vedere queste pagine indicizzate.
1.3. Come rimuovere il prodotto che costruisce i duplicati
1.3.1. Mediante Strumenti di Webmaster di Google
Entra in Strumenti per i webmaster di Google scegli il tuo sito ecommerce e nel menu a sinistra seleziona Scansione -> Parametri URL. Qui vedrai i parametri che Google ha trovato negli URL del tuo negozio, e in che modo li sottopone a scansione. “Lascia decidere a Googlebot” è l’opzione predefinita.
Ma quando si tratta di eseguire la scansione del tuo negozio Magento, sei tu, ma non Google, a decidere quali pagine devono essere indicizzate, giusto? Quindi se non l’hai deciso prima, è giunto il momento di farlo! Fai clic su “modifica”, seleziona “Sì” nel menu a discesa e quindi “Nessun URL”.
Puoi anche aggiungere parametri che non sono elencati in GWT e impostare le opzioni di scansione per Google. Ma fai attenzione e controlla due volte (o anche tre volte) prima di bloccare gli URL con questi parametri.
Devi essere paziente, ci vuole molto tempo prima che Google re-indicizza gli URL con i parametri, una volta che sono stati indicizzati. Se vuoi, puoi anche rimuoverli dall’indice manualmente tramite Indice Google -> Rimozione URL.
1.3.2. REL = CANONICAL
Puoi anche scegliere di utilizzare il parametro CANONICAL per le pagine di ordinamento nel tuo negozio Magento. In questo modo saranno accessibili agli utenti ma reindirizzeranno i crawler alle pagine senza parametri.
È necessario aggiungere questo codice alle pagine di ordinamento:
dove CategoriaURL è l’indirizzo della stessa pagina di categoria senza parametri. Ad esempio, le seguenti pagine:
- http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|desc
- http://miosito.it/categoria/prodotto.htm?sortby=total_reviews|asc
- http://miosito.it/categoria/prodotto.htm?sortby=relevance|desc
dovrebbe canonicalizzare questa pagina
- http://miosito.it/categoria/prodotto.htm
Guido Pratt
Magento Specialist