X
Utilizziamo cookie nostri e di terze parti per migliorare i servizi e analizzare le tue preferenze. Continuando la navigazione accetterai automaticamente l'utilizzo dei cookie.
Per maggiori informazioni e modificare le impostazioni visita la pagina dedicata ai cookie.

SEO

Versione Italiana | English Version | Version Française | Versión en español
Qt S60 Mobile Bluetooth Implementation
Qt Symbian HostNotFound Error

Los algoritmos genéticos aplicados al tema SEO (Search Engine Optimization)

En este artículo se muestra cómo se utilizó el enfoque de algoritmos genéticos para optimizar la distribución de los enlaces de los sitios web para maximizar el rango promedio de cada uno de los páginas web.

La teoría

Comenzaremos por explicar cómo un enlace sobre el análisis de algoritmo de clasificación (LAR), que son utilizados por los motores de búsqueda para hacer un 'orden (o ranking), de páginas web. Se deduce la importancia de una página web sobre la base de la estructura topológica de la gráfica, extraídos por el análisis de los vínculos del sitio en cuestión, y analizar a lo largo de los arcos de salida y de los arcos, es decir, los vínculos salientes y entrantes enlaces de páginas que componen el gráfico. Sobre la base de esta información es un valor asociado a cada página, que se utilizará para la clasificación.

El predecesor de algoritmos de análisis de enlace ranking es InDegree que calcula la popularidad de una página, teniendo en cuenta el número de páginas que tienen un vínculo a ella. Algoritmos más recientes y más refinados son los siguientes:

  • PageRank PageRank
  • Kleinberg (denominado en lo sucesivo HITS)
  • Salsa Salsa

PageRank siguiente manera aleatoria un gráfico de la web, en el que cada página de su peso se extiende a las páginas a las que los vínculos, lo que resulta en una gama de pesos a raíz de pesos de la autoridad. El algoritmo completo para el cálculo del PageRank se basa en la utilización de la teoría de los procesos de Markov.

Kleinberg propuesto un esquema de propagación de pesos en dos niveles, dando lugar a los valores de autoridad y también los valores del centro. Una página con un elevado centro, es una página que contiene enlaces a páginas de calidad (es decir, con una alta autoridad) y simétricamente una página con una alta autoridad, será una página de muchos buenos apuesta centro.

Salsa es un híbrido entre los dos algoritmos anteriores.

A la aproximación de estos algoritmos tener en cuenta la fórmula originalmente desarrollada por los fundadores de Google.

Rank[A] = ( 1 - d ) + d (Rank[P1] / Link[P1] + ..... + Rank[Pn] / Link[Pn] )
  • Rank[A] es el valor de Page Rank Lo que queremos calcular
  • P[1]...P[n] son las páginas que contienen un enlace A
  • Rank[P1] ... Rank[Pn] son los valores de la Fila páginas P1 ... Pn
  • Link[T1] ... Link[Tn] son el número total de enlaces de la página que ofrece enlaces
  • d (factor de amortiguamiento) es un factor que Google decidió que la documentación original se convierte en 0,85. Puede ser ajustado por Google para determinar el porcentaje de PageRank, que debe pasar de una página a otra y el valor del rango mínimo asignado a cada una de las páginas en la base de datos.

Los algoritmos en cuestión son, evidentemente, mucho más compleja y nuestro objetivo no es reproducir fielmente, pero para obtener un modelo matemático que puede para un enfoque de "Nuestro valor de ranking que nos permitan determinar la bondad de la estructura topológica calculado el "algoritmo genético después de haber sido aplicada.

Veamos ahora un panorama general de algoritmos genéticos.

L 'algoritmo genético es un algoritmo para analizar los datos y pertenece a una clase particular de algoritmos utilizados en diversas esferas, incluida la' inteligencia artificial. Se trata de una heurística de búsqueda y optimización, basados en el principio de la selección natural de Charles Darwin que rige el desarrollo.

Principios Operativos

Un algoritmo genético típico de una serie de posibles soluciones (individuos) se pide la población y por su evolución durante la ejecución: cada iteración, se hace una selección de los miembros del público se utiliza para generar nuevos elementos de la población , Que sustituirá a un número igual de los trabajadores ya presentes y, por tanto, constituyen una nueva iteración de la población (o generación) a continuación. La sucesión de las generaciones para evolucionar una solución óptima del problema asignado.

L 'evolución se obtiene a través de una recombinación de soluciones parciales, cada uno de transmitir parte de su patrimonio genético a sus descendientes. La introducción de mutaciones en la población de partida al azar, en ocasiones genera nuevos trabajadores, con características que no están incluidos entre los presentes en la genética de la especie original.

Una vez que la etapa de la evolución, la población generados en cada iteración, se analiza y se requieren sólo soluciones que mejor resuelve el problema: las personas con las cualidades más adecuado medio ambiente en que se encuentran tienen más probabilidades de sobrevivir y reproducirse. Estas soluciones van a sufrir una nueva fase de desarrollo y así sucesivamente.

En la final, esperamos encontrar una población de soluciones que puedan resolver adecuadamente el problema. No hay forma de determinar de antemano si el algoritmo realmente ser capaz de encontrar una solución aceptable. Por regla general, los algoritmos genéticos se utilizan para la optimización de problemas para los que no se sabe algoritmos de complejidad o polinomio lineal.

Detalles de la operación

La solución del problema está codificado en una estructura de datos, por lo general una cadena, llamado gen.

Inicialmente crea un número de genes al azar y se define una función que devuelve la "bondad" de un gen como una solución al problema, dijo función de idoneidad.

El algoritmo se compone de las operaciones que tienden a alterar la población de genes en un intento de mejorar de manera que una mejor solución.

La evolución proceder en los pasos, para cada uno de ellos es por primera vez una especie de los genes sobre la base del resultado de la función de fitness. A continuación, realiza las operaciones en un número de genes parámetros establecidos por el algoritmo, que por lo general determinar cuántos genes deben someterse a crossover y mutación, y en qué medida.

El algoritmo se desarrolla a continuación, a través de los siguientes puntos:

  • Generación, en una población aleatoria inicial;
  • Creación de una secuencia de nuevas poblaciones, o generaciones. En cada iteración, los actuales miembros del público son utilizados para crear la próxima generación y con este fin, que las medidas adicionales:
    • Cada uno de los miembros de la población actual se estima el cálculo del valor de su aptitud (fitness)
    • Se determina un orden adecuado de las personas sobre la base de los valores de fitness
    • Las más prometedoras son las personas seleccionadas como padres
    • De estas personas generará un número igual de individuos de la próxima generación, y esto puede hacerse de dos maneras, es decir, haciendo cambios al azar en un solo padre (mutación) o combinando adecuadamente las características de un par de los padres (de cruce )
    • Por lo tanto, las personas se genera para sustituir a los padres por permitir la formación de la próxima generación
  • Por último, el algoritmo s'interrompe cuando uno de los criterios para la detención está satisfecho.

De acuerdo a un coeficiente determinado inicialmente, algunas partes de los genes mejores resultados se intercambian, en el supuesto de que esto puede mejorar el resultado de la función de aptitud en el próximo "paso evolutivo".

Single point crossover

Existen diversas técnicas de cruce. Uno de los más simple es el "único punto de cruce", que consiste en tomar dos trabajadores y cortar sus cadenas de codificación en un caso en punto. Crea dos cabezas y dos colas. Ahora el intercambio de los jefes y las colas, obteniendo dos nuevos genes. El crossover no siempre es aplicado, pero con una probabilidad pc. En caso de que no se aplica los niños son simplemente copias de los padres.

Experimentalmente se puede ver que la mejora es bienvenida después de una serie de medidas. Esto en los casos de menos afortunados, por supuesto.

Mutación

La mutación es el azar cambios en las porciones de genes con un valor inferior de aptitud, sobre la base de factores definidos inicialmente. Estos cambios tienen por objeto mejorar el valor de la función de los genes en cuestión.

En realidad no es correcto pensar sólo de la evolución de los cromosomas con menor aptitud, con el fin de proporcionar una mayor capacidad de exploración del algoritmo (y no terminar en "agujeros" en el excelente local) también se consideran útiles las mutaciones de los cromosomas con el mismo de alta aptitud. En última instancia, las mutaciones principalmente servido para explorar el ámbito de la investigación, no para mejoras.

Solicitud

Y es el gráfico de la página en cuestión que se aplicará el "algoritmo genético.

La representación se utiliza para la matriz de adyacencia.

La matriz de una estructura particular cerca de datos comúnmente utilizados en la representación de gráficos. En particular, se utiliza ampliamente en la preparación de algoritmos que operan en los gráficos y su representación en el cómputo general.

Dado que cualquier gráfico de su matriz de adyacentes se compone de una matriz cuadrada binaria que tiene los índices de filas y columnas de los nombres de la parte superior del gráfico. En el lugar (i, j) de la matriz es un 1, si y sólo si existe un arco en el gráfico que va de cumbre en cumbre de la j, de lo contrario, hay un 0.

Si en lugar de 1 en la matriz son los números, estos se interpretan como el peso dado a cada arco. Por ejemplo, si todos los vértices de la gráfica representa una serie de puntos en un mapa, el peso de las cadenas puede ser interpretado como la distancia de los puntos que conectan. En nuestro caso, indicar la cantidad de enlaces.

En el caso de la representación de los no orientados a gráficos, la matriz es simétrica a la diagonal principal.

Una de las características de esta matriz se le permite obtener el número de rutas de un nodo a nodo i j que deben cruzar n nodos. Para lograr todo esto es suficiente para la misma potencia n-matriz y ver el número que aparece en lugar i, j.

Como ya se explicó un gen es una cadena binaria y, a continuación, una secuencia de 0 y 1. La idea detrás de este algoritmo es una matriz que puede ser visto como una cadena binaria y, a continuación, un gen. Si queremos que es el acceso a la posición en X, Y, de una matriz organizada como una cadena, solo se aplica la siguiente fórmula:

Value(x,y) = Matrix[ (y*matrixsize) +x ]

Aplicando un algoritmo genético para representar gráficamente el sitio antes de que usted pueda tener una mejor estructura topológica que mejora el rango de páginas individuales.

Se han estudiado y aplicado en otros procesos de evolución que se explicó previamente cruzado, diseñados especialmente para el SEO problema.

La función de adecuación es muy compleja y entre los parámetros que tener en cuenta son el promedio de rango de páginas de objetivo, el número medio de enlaces por página y el número de páginas de vacío.

El objetivo son las páginas páginas del sitio que es nuestro especial interés. Normalmente, en la mayoría de los casos, estas páginas de hoja.

Por algo la página es una página con el mismo rango igual a 0,15 (es fácil deducir de la fórmula de rango supra), o el valor determinado por el usuario.

L 'algoritmo es capaz de tener en cuenta las limitaciones de la editorial y evolucionar en función de ellos.

Los resultados

Caso 1

La aplicación nos ha permitido hacer nuevas consideraciones sobre los que antes, tal vez, se consideraron las certezas de la Estrategia Europea de Empleo.
Hablando con varios SEO especialista, leer los foros, una de las consideraciones que hace la mayoría es que hay que "equilibrar" la distribución de enlaces. O (en lo que respecta a los enlaces internos), si una página de un enlace a un "otro, es conveniente que las piezas de repuesto, o fancedo cuentas de servir para cada una de las páginas, enlace saliente tiene muchos, muchos deben tener operadores.

El modelo matetematico, sin embargo, parece decir, completamente contrario. Pagine El "objetivo", queremos maximizar es el nodo 5.

Circular modelo

nodo 1 → 0.999518
nodo 2 → 0.999591
nodo 3 → 0.999652
nodo 4 → 0.999704
nodo 5 → 0.999749
Modelo complejo

nodo 1 → 1.377268
nodo 2 → 1.714694
nodo 3 → 0.993759
nodo 4 → 0.544196
nodo 5 → 0.265642

Como podemos ver en el complejo modelo, la página que quería construir era aún penalizado. Es evidente que este ejemplo es bastante forzado, pero es una simplificación de la estructura de muchos sitios web. La intención de este ensayo es, obviamente, no sugieren un patrón circular de sus sitios, pero para mostrar cómo no se descartó la validez de las estructuras de los que estamos convencidos.

Caso 2

A raíz de los resultados de la aplicación de "algoritmo genético en: http://www.fratellileonelli.it
Usted puede ver la representación gráfica de 3D, antes y después del juicio. El tamaño de las zonas verdes indican el valor de Page Rank, mientras que las cadenas están representados en púrpura.

Antes de la aplicación
Antes de la aplicación
Después de la aplicación
Después de la aplicación

Lo vemos de un vistazo la diferencia entre antes y después del tratamiento. Las bolas (páginas web individuales) tienen un diámetro más grande, lo que significa mayor rango, y están mucho más interconectados.


Un extracto del algoritmo genético resultados
Url Primera Después Variación %
/20.86998413.694373-34.3824
/come-raggiungerci/1.9239491.051139-45.3655
/foto/3.0787811.464144-52.444
/eventi/1.9821731.14884-42.0414
/progettazione/20.34529513.828813-32.0294
/realizzazione/20.46470313.718434-32.9654
/manutenzione/20.57415813.976818-32.0661
/potatura/20.67448814.024247-32.1664
/erbacee-perenni/29.89837522.935853-23.2873
/arbusti/26.29643116.967085-35.4776
/foto/azienda-florovivaistica-leonelli-0007/0.2154241.110144415.33
/foto/azienda-florovivaistica-leonelli-0008/0.2154240.29862138.6201
/foto/azienda-florovivaistica-leonelli-0009/0.2154240.32209349.5158
/foto/azienda-florovivaistica-leonelli-0010/0.2154240.518017140.464
/eventi/mostra-mercato/0.3184851.077961238.466
/eventi/open-day/0.3184850.40023325.6678
/erbacee-perenni/agastache/rupestris/0.2881620.38049732.0427
/erbacee-perenni/ajuga-reptans/atropurpurea/0.2881620.35359122.7053
/erbacee-perenni/alchemilla/mollis/0.2881620.43985352.6408
/erbacee-perenni/allium/karataviense/0.2886830.53878786.6362
/erbacee-perenni/allium/tuberosum/0.2886830.36386226.0422
/erbacee-perenni/allium-karataviense/ivory-queen/0.2881620.314569.16076
/erbacee-perenni/alyssum/montanum/0.2891210.45696658.0534
/erbacee-perenni/alyssum/saxatile/0.2891211.010271249.429
/foto/azienda-florovivaistica-leonelli-0001/0.2154240.29164235.3805
/foto/azienda-florovivaistica-leonelli-0002/0.2154240.26832324.5558
/foto/azienda-florovivaistica-leonelli-0003/0.2154240.28124930.5559
/foto/azienda-florovivaistica-leonelli-0004/0.2154240.33584855.9007
/foto/azienda-florovivaistica-leonelli-0005/0.2154240.35353364.1102
/foto/azienda-florovivaistica-leonelli-0006/0.2154240.31786447.5525
/erbacee-perenni/alyssum/saxatile-compactum/0.2891211.260897336.114
/erbacee-perenni/amsonia/tabernaemontana/0.2881620.54298488.4299
/erbacee-perenni/anemone/honorine-jobert/0.2900980.39012534.4802
/erbacee-perenni/anemone/konigin-charlotte/0.2900980.35142221.139
/erbacee-perenni/anemone/prinz-heinrich/0.2900981.071951269.513
/erbacee-perenni/anemone/richards-ahrends/0.2900980.43524250.0325
/erbacee-perenni/anemone/rosenschale/0.2900980.39189635.0908
/erbacee-perenni/anemone/whirlwind/0.2900980.3346415.354
/erbacee-perenni/aquilegia/vulgaris/0.2881621.104393283.254
/erbacee-perenni/aquilegia-cerualea/red-hobbit/0.2881621.041284261.353
/erbacee-perenni/aquilegia-cerulea/rose-queen/0.2881620.34679620.3473
/erbacee-perenni/aquilegia-flabellata-pumila/ministar/0.2881620.39112335.7299
/erbacee-perenni/aquilegia-hybride/biedermeier/0.2881620.4502256.2383
/erbacee-perenni/arabis-caucasica/snowball/0.2881620.39051735.5197
/erbacee-perenni/arenaria-montana/alba/0.2881620.43730651.7567
/erbacee-perenni/artemisia/powis-castle/0.2886830.34034617.896
/erbacee-perenni/artemisia/stelleriana/0.2886831.002906247.407
/erbacee-perenni/asclepias/tuberosa/0.2881620.40472340.4497
/erbacee-perenni/aster/snow-flurry/0.2881620.49603272.1363
/erbacee-perenni/aster-dumosus/kippenberger/0.2886830.34891520.8643
/erbacee-perenni/aster-dumosus/schneekissen/0.2886830.34566419.7384
/erbacee-perenni/aster-laterifolius/lady-black/0.2881620.35959524.789
/erbacee-perenni/astilboides/tabularis/0.2881620.40452240.38
/erbacee-perenni/aubretia/blue-cascade/0.2881620.34845420.9227
/erbacee-perenni/begonia/envasiana-bianca/0.2881620.40579340.8208
/erbacee-perenni/belamcanda/chinensis/0.2881620.33134714.9863
/erbacee-perenni/brunnera/macrophilla/0.2881620.44786955.4226
/erbacee-perenni/callirhoe/involucrata/0.2881620.55003990.878
/erbacee-perenni/campanula/loddon-anna/0.2891210.42371746.5537
/erbacee-perenni/campanula/porscharskyana-lisduggan/0.2891210.44134652.6511
/erbacee-perenni/campanula/poscharskyana-stella/0.2891210.35155421.5942
/erbacee-perenni/campanula-persicifolia/telham-beauty/0.2881620.47605765.2042
/erbacee-perenni/campanula-poscharskyana/eh.-frost/0.2881620.42013645.7984
/erbacee-perenni/campanula-punctata/rubriflora/0.2881620.44112653.0825
/erbacee-perenni/centaurea/pulcherrima/0.2881620.44010952.7295
/erbacee-perenni/centranthus/ruber/0.2881620.38574533.8636
/erbacee-perenni/ceratostigma/plumbaginoides/0.2881621.198788316.011
/erbacee-perenni/chrisantemum-coccineus/robin-red/0.2881620.38702934.3093
/erbacee-perenni/chrysantemum/weirichii/0.2881621.040353261.03
/erbacee-perenni/cimicifuga/racemosa/0.2881620.36412626.3612
/erbacee-perenni/convallaria-japonica/nana/0.2881620.48250567.4419
/erbacee-perenni/coreopsis/grandiflora-aureo-marginata/0.2891210.47727565.0779
/erbacee-perenni/coreopsis/verticillata-grandiflora/0.2891211.244313330.378

Es importante señalar que el algoritmo ha tratado de distribuir de manera más homogénea el rango del sitio.
La tabla con los resultados finales se destacan en rojo los más importantes.

Las páginas están en los menús como se puede imaginar son los de mayor rango, tanto antes como después. Sin embargo, su rango se redujo la meta de las páginas.

Por supuesto, este comportamiento puede ser impulsada por la necesidad. En este caso el cliente es importante para elevar el rango de páginas que contienen la descripción de la planta, por lo tanto, l 'algoritmo ha evolucionado en esta dirección.

Como resultado se puede ver cómo se coloca enlaces adicionales calculados por el proceso:

Si usted está interesado en aplican (por libre), el software descrito, simplemente descargar genesis


Sebastiano Galazzo

tel .: +39 338 5482810

18 novembre 2008

Commenti

sYhzVLTDVaRnvtF
2011-10-25 20:57:10
Wow, that's a really clveer way of thinking about it!

ITHINKSEARCH
2009-03-07 09:06:14
Me ha gustado mucho tus indicaciones. Por favor contacta conmigo para decirme donde se encuentra el software y como se puede usar. Muchas gracias

La tua domanda