Google en el presente es el buscador más utilizado mundialmente.
Puntualmente en Argentina el 80% de las búsquedas se realizan en google, alrededor de un 10% en bing y el otro 10% está repartido entre otros buscadores. Por esto es más que imprescindible para los queramos saber más sobre seo conocer la forma en que google trabaja. Entonces…
¿Cómo funciona Google?
Google tiene 3 partes diferentes:
- “Googlebot”, es un rastreador de páginas webs.
- “Indexer” (o indexador), clasifica cada palabra de cada página y almacena el índice en una enorme base de datos.
- “Query processor” (procesador de consultas), compara la busqueda con el index y arroja los resultados más relevantes (seguún Google).
- Googlebot, rastreador de paginas web
Encuentra y devuelve páginas que estan en la web, dejandolas en mano del indexador. Googlebot funciona muy parecido a tu browser, enviando una solicitud a un servidor web para entregar una página web, descargando toda la página y luego entregandolo al indexador de googlebot.Googlebot se compone de varios servidores buscando y solicitando páginas más rápido que lo que podríamos hacer 100 personas con nuestros browsers. De hecho googlebot puede solicitar miles de páginas de forma simultanea. Para evitar que los servidores web interrumpan las peticiones de los “usuarios humanos”, googlebot hace deliberadamente las peticiones de cada servidor web individual mas lentamente de lo que es capaz de hacer.Googlebot encuentra páginas de 2 maneras:- Mediante un formulario url (www.google.com/addurl.html)
- Por medio de enlaces rastreando la web.
- Google Indexer
Googlebot le da al indexador el texto completo de la página que encuentra. Estas páginas se almacenan el la base de datos del índice de Google. Este índice está ordenado alfabéticamente por el término de búsqueda, con cada entrada de índice almacena una lista de documentos en los que aparece el término y la ubicación dentro del texto. Esta estructura de datos permite un acceso rápido a los documentos que contienen los términos de la consulta de los usuarios.
Para mejorar el rendimiento de las búsquedas, Google ignora (no indexa) palabras comunes llamadas “stop words” (como el, es decir, en, o, de , como, porque, asi como algunos digitos y leras independientes). Las “stop words” son tan comunes que haces poco para restringir la búsqueda, y por lo tanto, con seguridad pueden ser descartadas. El indexer también pasa por alto algunos signos de puntuación y multiples espacios, así como convierte también todas las letras en minúscula para mejorar la performance del buscador. - Google query processorEl procesador de consultas tiene varias partes, incluyendo la interfaz de usuario(cuadro de búsqueda), el “motor” que evalúa las consultas y los compara a los documentos pertinentes, y el formateador resultados.
Google considera que más de cien factores para calcular el PageRank y determinar cuáles son los documentos más relevantes para una consulta,incluyendo la popularidad de la página, la posición y el tamaño de los términos de búsqueda dentro de la página, y la proximidad de los términos de búsqueda entre sí en la página. Una solicitud de patente analiza otros factores que Google tiene en cuenta al ranking de una página. Visita informe SEOmoz.org ’s de una interpretación de los conceptos y las aplicaciones prácticas que figuran en la solicitud de patente de Google.
Google también se aplica la máquina de aprendizaje de técnicas para mejorar su funcionamiento de forma automática mediante el aprendizaje relaciones y asociaciones entre los datos almacenados. Por ejemplo, el sistema de corrección de ortografía utiliza estas técnicas para averiguar la ortografía alternativa probable.Google guarda celosamente las fórmulas que utiliza para calcular la relevancia, sino que son ajustados para mejorar la calidad y el rendimiento, y para burlar a las últimas técnicas utilizadas por los spammers tortuosos.
La indexación del texto completo de la web permite a Google para ir más allá del simple juego único términos de búsqueda. Google da más prioridad a las páginas que tienen los términos de búsqueda cerca unos de otros y en el mismo orden en la consulta. Google también puede coincidir con varias palabras frases y oraciones. Dado que el código HTML los índices de Google, además del texto en la página, los usuarios pueden restringir las búsquedas en la base de que las palabras de la consulta aparecen, por ejemplo, en el título, en la URL, en el cuerpo, y en los enlaces a la página, las opciones que ofrece Formulario de búsqueda avanzada de Google y cómo utilizar los operadores de búsqueda (Operadores avanzados).
Fuente
No hay comentarios:
Publicar un comentario