Servizi > Guida al monitoraggio e all'analisi delle statistiche del proprio sito web
Introduzione
L’analisi delle statistiche sugli accessi al proprio sito Internet è uno degli elementi fondamentali
di verifica del successo del proprio progetto. Infatti le statistiche ci permettono di conoscere
non solo quanti utenti hanno visitato il sito, ma soprattutto quali percorsi di navigazione
utilizzano, quanti minuti rimangono su una pagina, ecc.
Il visitatore di un sito web lascia sempre traccia di sé e dei suoi movimenti. Per quanto il
visitatore possa restare anonimo, viene comunque identificato dal server che ospita le pagine
web.
Utilizzando appositi strumenti si possono effettuare statistiche, sulla base di qualsiasi arco
temporale, su:
• Numero di visitatori unici per giorno, mese, anno
• Giorni e ore di maggior traffico sul proprio sito web
• Statistiche di accesso a ogni singola pagina o sezione visualizzata
• Pagine più visitate e meno visitate
• Pagine di entrata al sito e pagine di uscita
• Percorsi di navigazione
• Siti di provenienza dei visitatori (Referrer Link)
• Motore e chiave di ricerca di provenienza
• Siti verso i quali il proprio sito genera traffico
• Numero di utenti che dalla homepage passano ad altre pagine
• Numero di accessi multipli (stesso visitatore che accede più volte al sito)
• Tempo di permanenza sulle pagine
• Browser e sistema operativo utilizzati per la navigazione del sito
• Area geografica e lingua di provenienza
• Altri dati
Informazioni così dettagliate e precise vengono poi utilizzate per rendere il sito sempre più
adatto alle esigenze dell'utente e per controllarne eventuali problemi di visualizzazione.
Modalità di effettuazione delle statistiche
I sistemi maggiormente utilizzati per analizzare con precisione il traffico sul sito sono:
- registrazione di attività sul server attraverso i LOG FILE
- analisi dei cookies: i cookies (“biscottini”) sono piccoli file di testo che il server web
invia nell'hard disk del computer del navigatore, che li salva e li rimanda indietro a ogni
successivo contatto col server. I cookies tracciano i comportamenti degli utenti e
memorizzano i siti visitati o gli acquisti fatti
- analisi diretta dell'attività sul server:
I dati da analizzare vengono forniti da un "log file" del sito web, ovvero quel file che ogni
server internet produce con l’obiettivo di tracciare passo per passo, scrivendone le
informazioni, tutti le azioni che vengono compiute da un navigatore per la consultazione delle
informazioni disponibili.
Log File
Cos'è un log di un sito web?
Buona parte delle rilevazioni statistiche sul traffico generato dai siti Internet sono effettuate da
programmi che analizzano e presentano, in forma comprensibile al lettore umano, i dati
memorizzati momento per momento dai server web nei propri file di log.
Quando un visitatore accede ad un sito lascia una traccia del suo passaggio in un archivio
("log") che registra tutte le richieste effettuate a quel determinato sito ed in particolare ora,
indirizzo IP utente, oggetto della richiesta (pagina web, immagine, video), browser utilizzato.
Un log è un file contenente linee di testo chiamate "hit" (accesso). Ogni hit fa riferimento ad
uno specifico oggetto richiesto; per il caricamento di una pagina potranno essere richiesti più
oggetti (pagina web, immagini, file audio, ecc.), questi saranno registrati singolarmente nel log
(avremo in questo caso più hit).
Possiamo suddividere i file di registro (log file) in quattro categorie principali:
1. Transfer (o access) log - Registra tutte le richieste di trasferimento file pervenute ad
un server tramite protocollo HTTP dagli utenti collegati via Internet. I dati in esso
raccolti sono una buona misura del carico di lavoro a cui è sottoposto un server web.
2. Error log - Memorizza tutte le richieste HTTP che non hanno prodotto il risultato atteso
dall'utente. Rientrano in questa categoria il ben noto errore "404 File not found’", gli
errori di timeout (= scadenza del tempo di attesa), le connessioni rifiutate, quelle
interrotte, i messaggi di server "too busy" (= troppo occupato), ed altri ancora. L'analisi
degli errori riportati in questo file di registro è utile per correggere possibili squilibri
nella struttura di un sito, per scoprire la presenza di collegamenti interrotti, per
verificare se la potenza di elaborazione della CPU o la banda di connessione ad Internet
siano sufficienti rispetto al volume di traffico generato.
3. Referrer log - Tiene traccia della provenienza delle richieste di trasferimento di file
ricevute dal server. È in genere meno usato dei due log precedenti.
4. Agent (o user agent) log - Registra il tipo di software che invia una richiesta HTTP al
server web. Le informazioni fornite da questo file di registro riguardano il tipo e la
versione di browser utilizzato dall'utente, il sistema operativo usato, la risoluzione
video.
Come ottenere i log del sito web?
Basta richiederli all'internet provider che ospita il sito; in genere questi sono a disposizione
dell'utente in una directory del proprio spazio ftp chiamata "logs" o "stats".
Come analizzare e interpretare i log file?
La misurazione del traffico è realizzata soprattutto usando i software di rilevamento e i
registri dell'attività del server. Generalmente i software disponibili sul mercato possiedono una
versione base gratuita e versioni a pagamento che permettono analisi più approfondite e
dettagliate dei dati.
Alcuni esempi dei principali software utilizzati sono:
www.webtrends.com
www.mrunix.net/webalizer
www.megastats.com
www.WebStats.com
E’ comunque opportuno precisare che sono innumerevoli i software disponibili su Internet e
che è possibile realizzare una ricerca sui principali motori (digitando ad esempio le parole
chiave Stats, web trens, statistics, ecc) per trovare altri esempi e fare delle comparazioni.
Il software di analisi del traffico prende quindi i dati grezzi e li interpreta per più facile lettura.
Accessi, impressions e hits
Occorre puntualizzare che per accesso si intende la permanenza di un visitatore all'interno del
sito, indipendentemente dal numero di pagine visualizzate. C'è poi differenza tra pagine
visitate (impressions) e hits, che sono gli oggetti scaricati dal browser (testo, immagini, filmati,
suoni) che complessivamente formano una pagina. Le statistiche sugli hits solo raramente ed
in casi particolari sono significative.
Tutti i software misurano le impressions, ma occorre fare attenzione a possibili sottostime di
queste ultime, causate da "caching", " site mirroring" e "firewalls".
Con il caching ed il site mirroring, la pagina è inviata una volta, quindi immagazzinata
localmente sul computer dell'utente o sul computer del provider. Quando la pagina è
visualizzata successivamente (dallo stesso utente o da altri utenti) è richiamata dalla memoria
locale piuttosto che dal sito web. È più veloce per i navigatori, ma impedisce al software di
rilevazione il conteggio di queste come impressions inviate dal web server.
I firewall sono usati dalle intranet aziendali per sicurezza, ma possono anche causare una
sottostima delle impressions perché è possibile che tutti gli impiegati vengano identificati dallo
stesso indirizzo aziendale.
Una soluzione adottata da molti siti per correggere la quantificazione del traffico è utilizzare i
cookies, anche se questi ultimi sono soltanto parzialmente utili nell' identificare gli ospiti in
modo univoco perché possono essere disattivati o l'utente può usare diversi computer e
browser con cookie differenti, il che li rende uno strumento di conferma non proprio perfetto.
Gli ingorghi di Internet possono indurre l'utente a chiedere ripetutamente la stessa pagina fino
a visualizzala completamente. Ma il software di rilevamento del traffico conta tutte le richieste
della pagina, dando quindi un numero di impression in eccesso.
Le analisi statistiche
Vuoi saperne di più sull'installazione di programmi per le analisi delle statistiche di accesso ad un sito web? Contattaci all'indirizzo e-mail info@apiceweb.com