Crawler
uri
La uri da analizzare. Un esempio : www.witinside.net/honda/concessionari/lombardia/
Il crawler procederà in profondità senza uscire dal dominio, in questo caso www.witinside.net e non elabora
pagina con una profondità minore della url inserita. In questo caso la url www.witinside.net/honda/concessionari/toscana/ non verrà
elaborata, mentre www.witinside.net/honda/concessionari/lombardia/milano/ si
noindex
Questo campo prevede di poter intervenire sulle pagine web in esame. Valorizzandolo, ad esempio con genetic, ma è possibile immettere
qualsiasi testo, durante l'analisi della pagina, per l' estrazione dei link, la porzione di html delimitata tra
<!--genetic--> e <!--/genetic--> non verrà considerata.
L' utilità di questa opzione sta nel poter escludere alcuni link.
crawl limit
Il numero massimo di pagine da analizzare. Di default, il numero massimo di pagine indicizzabile è 500 ed è legato al tipo di account. Se avete necessità di aumentare la soglia di 500 pagine, occorre contattare l'autore.
cache
Essendo l'operazione di download di pagine web dispendiosa, l'applicazione mantiene una cache. Attivando questa opzione quando si avvia il crawler le pagin web vengono lette dalla cache, quindi da disco. Disattivando questa funzione otterrete che l'applicazione si scaricherà le pagine da internet e aggiornerà la cache.
blacklist
Qui potete escludere dei path dalla navigazione del crawler. I path devono essere della forma :
/honda/concessionari/lombardia/milano/
È anche possibile caricare un file di testo con un elenco di path nella forma sopra indicata.

Alla fine del processo avrete una schermata di questo tipo

Nel tab console avrete la dicitura: Grafo nizializzato
Avete adesso le informazioni sullo stato attuale del sito ed una mappa visiva della distribuzione del rank.
La linea verde rappresenta il valore massimo normalizzato o per renderlo più semplice potete considerarla come il massimo.
I pixel rossi rappresentano il rank delle pagine in esame. Più è alto ovviamente più è elevato il rank.
Nell'angolo in basso a sinistra dell'immagine, potete notare la home page tipicamente la pa gine con maggiore rank.
Nelle prossime release è previsto di poter visualizzare rank e nome pagina al passaggio del mouse al fine di facilitare la lettura.
A questo punto, se volete, potete salvare il grafo del sito in esame. Questo vi permetterà di poter caricare il modello del sito senza riprocessare il tutto.

Importante: Verranno enerati una serie di file, mettere solamente il prefisso che si vuole dare a questi.

I files generati sono i seguenti:
- _PREFIX_graph.csv
- _PREFIX_rank.csv
- _PREFIX.sql
- _PREFIX.lua
- _PREFIX.png
- _PREFIX_leaf.csv
- _PREFIX_graph_inv.csv
Sebastiano Galazzo
tel .: +39 338 5482810
18 novembre 2008