Dall’effimero all’eterno, ovvero come gestire le migrazioni dei siti

D

7323349248_30a5c6228d_k

Chi progetta siti, specialmente istituzionali, è gravato sicuramente da una serie di incombenze maggiori rispetto a chi gestisce siti aziendali o personali: sebbene le *best practice* dovrebbero essere condivise, in realtà alcuni siti che rappresentano un **valore documentale per la nazione** si trovano a dover prestare **maggiore attenzione** a quello che fanno.

In questo caso mi riferisco, principalmente, alle problematiche di spostamento dei contenuti all’interno del sito web: se infatti è normale che a seguito di un profondo restyle del sito web gli indirizzi dei documenti cambino anche sostanzialmente (ad esempio passando da *www.sito.it/doc/ita/pippo.pdf* a qualcosa come *www.sito.it/xxx/pippo.pdf*), è anche vero che questo cambiamento stupido in superficie rappresenta un cambiamento **incredibilmente rischioso** e **tremendamente impattante** nella realtà dei fatti: come è **standard della rete**, infatti, chiunque abbia necessità di impostare una referenza ad un documento, magari pubblico, provvederà non già a copiarlo e a memorizzarlo separatamente, ma a creare un link ad un particolare indirizzo sul sito che gli interessa. Questo comportamento, perfettamente normale ed in linea con le *best practice* della rete, viene però totalmente stravolto dalla modifica delle url: quello che al webmaster che si occupa del re-design pare una cavolata di poco conto (*”Eh, tanto alla fine i documenti si trovano lo stesso!”*) rischia di minare decine di siti web, centinaia di tesi di laurea che referenziano il documento, migliaia potenzialmente di altre fonti dati che si affidano ad un link per la gestione delle referenze.

Un esempio fantastico di questo comportamento è presente su [Punto Informatico][c] nel bell’articolo (come sempre) dell’amico [Marco Calamari][c] nella sua rubrica [Cassandra Crossing][c], dove ci racconta come una serie di documenti importantissimi e di valore storico sul sito della [Banca d’Italia][c] sono totalmente spariti a causa di un restyling “sportivo” da parte di un webmaster poco attento alle dinamiche della rete a livello profondo e non solamente superficiale (leggasi non già **quanto è fico il sito web nuovo** ma bensì **come è davvero utilizzato il sito web**). Il risultato è devastante: centinaia di siti web e di tesi di laurea avranno al loro interno link a documenti ufficiali che non sono più presenti. Un banale restyling di un sito istituzionale al fine di avere un design più accattivante ha recato un danno storico enorme al patrimonio documentale non solamente contenuto nel sito stesso, ma anche contenuto in centinaia di altri documenti sparsi per la rete. Non si tratta di **innovazione**, ma di **crimine contro l’intera rete**.

C’è da dire che, per essere onesti, questa problematica non vale solamente per i **siti della PA**, ma per qualunque sito web al mondo, solo che normalmente le problematiche rivestono la sfera della indicizzazione sui motori di ricerca e rientrano quindi ne reami della scienza del SEO (*Search Engine Optimization*): se, infatti, cambio la URL in cui un documento o una pagina appaiono sui motori di ricerca **perdo il posizionamento ottenuto in mesi o anni di duro lavoro**… E potrebbero essere necessari mesi o anni per guadagnare le stesse posizioni.

Significa, quindi, che non posso più in alcun modo modificare le URL del mio sito web? Che non posso in alcun modo cambiare i sistemi di gestione contenuti (CMS) che cambiano gli indirizzi o non posso più modificare la struttura di navigazione? Assolutamente no, ovviamente: solamente devo conoscere un po’ di più dell’abbecedario del web ed imparare a gestire efficacemente come la rete gestisce queste tipologie di problematiche di trasferimento: con un comando particolare chiamato in gergo *codice 301* o *codice 302*.
Siamo forse abituati, infatti, a vedere nella rete il classico *errore 404*, che informa che il contenuto che stiamo cercando **non esiste più**, ma altri codici di stato sono gestiti in modo più intelligente, come ad esempio i codici di redirezione 30x, che dicono semplicemente che il contenuto è stato spostato e ci inviano automaticamente alla nuova destinazione. Gli errori 30x, infatti, definiscono il contenuto come *”temporaneamente spostato”* o *”definitivamente spostato”*, consentendoci di muovere al nuovo indirizzo, in modo automatico, i navigatori del web. Non solamente: gli errori 30x vengono anche ottemperati dai motori di ricerca che, invece di cancellare la pagina che non trovano più, indicizzano la nuova **mantenendo tutti i posizionamenti** faticosamente guadagnati.

Come si può quindi procedere a creare una procedura di migrazione dei contenuti intelligente? Sono possibili 3 differenti modalità di intervento: **totale a priori**, **ottimizzata a priori**, **ottimizzata a posteriori**. Vediamole singolarmente:

* **Redirezione Totale a Priori**: rappresenta la **migliore soluzione possibile**, ma anche la **più onerosa**. Si tratta infatti di creare un elenco di tutte le pagine presenti sull’attuale sito web, creare un nuovo elenco di tutte le pagine presenti sul nuovo sito web (qualora differiscano come URL) e creare per ciascuna difformità una regola sul nostro web server che crei una redirezione permanente (*codice 301*) per ciascuna vecchia pagina al nuovo contenuto. Questa analisi, anche se onerosa, ci consente di controllare che tutti i contenuti del vecchio sito web siano efficientemente migrati al nuovo sito web senza problematiche di perdita di alcun contenuto;

* **Redirezione Ottimizzata a Priori**: rappresenta un **buon compromesso**, anche se non certo perfetto, con una onerosità inferiore rispetto alla soluzione totale. Si tratta di creare un elenco, partendo dalla nostra piattaforma di statistiche, delle 100/200 pagine **più accedute e linkate** da parte degli utenti della rete, creare un nuovo elenco di dove queste pagine più popolari sono presenti sul nuovo sito web (qualora differiscano come URL) e creare per ciascuna difformità una regola sul nostro web server che crei una redirezione permanente (*codice 301*) per ciascuna vecchia pagina al nuovo contenuto. Questa tipologia di migrazione, sebbene **lungi dalla perfezione**, ci consente per lo meno di sincerarci che i contenuti più popolari e di maggiore usufruizione/link del vecchio sito web siano efficientemente migrati al nuovo sito web senza problematiche di perdita di contenuti vitali. Ovviamente perderemo, con questo approccio, una serie di contenuti comunque linkati esternamente ma non così di sovente acceduti: una ottimizzazione talvolta necessaria per siti con decine di migliaia di pagine, ma sicuramente lungi dalla perfezione;

* **Redirezione Ottimizzata a Posteriori**: rappresenta un sistema per **recuperare un danno** già effettuato, che lungi dall’essere una soluzione intelligente o responsabile, rappresenta comunque dopo una migrazione disinformata e distruttiva una possibilità di **salvare il salvabile**, con una onerosità di gran lunga inferiore alla ripianificazione dell’intero processo. Si tratta di stilare, a valle di una migrazione in cui **nessuna manovra di redirezione è stata effettuata**, un elenco estratto dalle statistiche del sito web delle pagine che stanno generando il numero maggiore di **Errori 404**, quegli errori cioè che dicono che una pagina che un utente sta accedendo non è più presente. Analizzando infatti gli errori è possibile a posteriori ricavare dopo poche settimane di utilizzo del nuovo sito web un elenco delle 100/200 pagine **più accedute e non più presenti** sul nostro sito web (che danno quindi un *errore 404*), creare un nuovo elenco di dove queste pagine più popolari sono presenti sul nuovo sito web (qualora differiscano come URL) o di quali documenti devo inserire (qualora non li abbia previsti nel nuovo sito internet) e creare per ciascuna difformità una regola sul nostro web server che crei una redirezione permanente (*codice 301*) per ciascuna vecchia pagina al nuovo contenuto. Questa tipologia di migrazione rivela una **pessima pianificazione**, una altrettanto **pessima gestione dei processi** ed una evidente **ignoranza dei meccanismi della rete**, ma consente comunque di sincerarci che i contenuti più popolari e di maggiore usufruizione/link del vecchio sito web siano per lo meno presenti e migrati al nuovo sito web senza perdita di contenuti vitali. Ovviamente perderemo, anche con questo approccio, i contenuti linkati esternamente ma non così di sovente acceduti: ma eviteremo di fare, comunque, la figura dei perfetti idioti;

Esiste ovviamente una quarta via, quella di **non fare nulla e perdere i contenuti**: se veramente qualche realtà la segue merita di essere esposta al pubblico ludibrio e di essere additata da tutti gli stakeholder istituzionali e/o di società civile come non solamente **ignorante dei mezzi**, non solamente **retrograda**, ma anche **sprezzante del ruolo istituzionale** che assolve. E ci sarebbe da valutare se questo comportamento non si configuri come un **danno alla cittadinanza** del quale rispondere anche economicamente.

Ecco, tutto qui. Segnatevi le metodologie, commentate per segnalarmene altre a cui non ho pensato o se volete farmi sapere la vostra opinione in merito.

Estote parati.

**Photo Credits: Flick user [kimbach](https://www.flickr.com/photos/kimbach/7323349248/in/photolist-ca95Ad-pZ9Ts3-7AaGw1-h4XZ37-5B3XDb-aqBwkM-nBUQuG-6cksr-8A4bJp-b4CT2B-c6nVfS-5pxJLr-7iwD2y-6RyLM7-nbmcoe-5ptfQq-f7iGUu-fuHtEJ-fqAqsq-apYydL/) released in CC**

[c]: http://punto-informatico.it/4206436/PI/Commenti/lampi-cassandra-uno-strappo-nella-rete.aspx
[moz]: http://moz.com/community/q/maintaining-link-value-of-old-urls-with-301-redirects

l'autore

Matteo Flora

Mi chiamo Matteo Flora, sono imprenditore seriale, docente universitario e keynote panelist e divulgatore. Mi occupo di cambiare i comportamenti delle persone usando i dati.
Puoi trovare informazioni su di me ed i miei contatti sul mio sito personale, compresi i link a tutti i social, mentre qui mi limito a raccogliere da oltre quattro lustri i miei pensieri sparsi.
Buona lettura.

3 commenti

Matteo Flora

Mi chiamo Matteo Flora, sono imprenditore seriale, docente universitario e keynote panelist e divulgatore. Mi occupo di cambiare i comportamenti delle persone usando i dati.
Puoi trovare informazioni su di me ed i miei contatti sul mio sito personale, compresi i link a tutti i social, mentre qui mi limito a raccogliere da oltre quattro lustri i miei pensieri sparsi.
Buona lettura.