X
Utilizziamo cookie nostri e di terze parti per migliorare i servizi e analizzare le tue preferenze. Continuando la navigazione accetterai automaticamente l'utilizzo dei cookie.
Per maggiori informazioni e modificare le impostazioni visita la pagina dedicata ai cookie.

SEO

Versione Italiana | English Version | Version Française | Versión en español
Qt S60 Mobile Bluetooth Implementation
Qt Symbian HostNotFound Error

Genesis - Istruzioni Crawler

Crawler

uri

La uri da analizzare. Un esempio : www.witinside.net/honda/concessionari/lombardia/
Il crawler procederà in profondità senza uscire dal dominio, in questo caso www.witinside.net e non elabora pagina con una profondità minore della url inserita. In questo caso la url www.witinside.net/honda/concessionari/toscana/ non verrà elaborata, mentre www.witinside.net/honda/concessionari/lombardia/milano/ si

noindex

Questo campo prevede di poter intervenire sulle pagine web in esame. Valorizzandolo, ad esempio con genetic, ma è possibile immettere qualsiasi testo, durante l'analisi della pagina, per l' estrazione dei link, la porzione di html delimitata tra <!--genetic--> e <!--/genetic--> non verrà considerata.

L' utilità di questa opzione sta nel poter escludere alcuni link.

crawl limit

Il numero massimo di pagine da analizzare. Di default, il numero massimo di pagine indicizzabile è 500 ed è legato al tipo di account. Se avete necessità di aumentare la soglia di 500 pagine, occorre contattare l'autore.

cache

Essendo l'operazione di download di pagine web dispendiosa, l'applicazione mantiene una cache. Attivando questa opzione quando si avvia il crawler le pagin web vengono lette dalla cache, quindi da disco. Disattivando questa funzione otterrete che l'applicazione si scaricherà le pagine da internet e aggiornerà la cache.

blacklist

Qui potete escludere dei path dalla navigazione del crawler. I path devono essere della forma :

/honda/concessionari/lombardia/milano/

È anche possibile caricare un file di testo con un elenco di path nella forma sopra indicata.



Genesis - Istruzioni Crawler

Alla fine del processo avrete una schermata di questo tipo

Genesis - Istruzioni Crawler Fine

Nel tab console avrete la dicitura: Grafo nizializzato

Avete adesso le informazioni sullo stato attuale del sito ed una mappa visiva della distribuzione del rank.
La linea verde rappresenta il valore massimo normalizzato o per renderlo più semplice potete considerarla come il massimo.

I pixel rossi rappresentano il rank delle pagine in esame. Più è alto ovviamente più è elevato il rank.
Nell'angolo in basso a sinistra dell'immagine, potete notare la home page tipicamente la pa gine con maggiore rank.

Nelle prossime release è previsto di poter visualizzare rank e nome pagina al passaggio del mouse al fine di facilitare la lettura.

A questo punto, se volete, potete salvare il grafo del sito in esame. Questo vi permetterà di poter caricare il modello del sito senza riprocessare il tutto.

Genesis - Istruzioni Crawler Salva

Importante: Verranno enerati una serie di file, mettere solamente il prefisso che si vuole dare a questi.

Genesis - Istruzioni Crawler Risultati

I files generati sono i seguenti:

  • _PREFIX_graph.csv
  • _PREFIX_rank.csv
  • _PREFIX.sql
  • _PREFIX.lua
  • _PREFIX.png
  • _PREFIX_leaf.csv
  • _PREFIX_graph_inv.csv


Sebastiano Galazzo

tel .: +39 338 5482810

18 novembre 2008

Commenti

PzVdIxvMPeZftCJIa
2011-10-25 09:06:28
Check that off the list of thngis I was confused about.

La tua domanda