Indexar un sitio en los motores de búsqueda. ¿Cómo funciona la indexación del sitio en "Yandex" y "Google"?
¿Qué es la indexación del sitio? Como te va Puede encontrar respuestas a estas y otras preguntas en el artículo. La indexación web (indexación en motores de búsqueda) se refiere al proceso de adjuntar información sobre un sitio a una base de datos como un robot de búsqueda, que se usa posteriormente para buscar información sobre proyectos web que han sido sometidos a tal procedimiento.
Los datos sobre los recursos web más a menudo consisten enPalabras clave, artículos, enlaces, documentos. El audio, las imágenes, etc. también se pueden indexar. Se sabe que el algoritmo para identificar palabras clave depende del dispositivo de búsqueda.
Hay un límite en los tipos de información que se indexa (archivos flash, javascript).
Gestión de la comunión
La indexación de un sitio es un proceso complicado. Para administrarlo (por ejemplo, para prohibir la introducción de una página en particular), debe usar el archivo robots.txt y prescripciones como Permitir, No permitir, Retraso de rastreo, Agente de usuario y otros.
También se usan para indexar etiquetas <noindex> y <nofollow>, que ocultan el contenido del recurso de los robots de Google y Yandex (Yahoo usa la etiqueta <nofollow>).
En el motor de búsqueda Goglle, los sitios nuevos se indexan de un par de días a una semana y en Yandex de una semana a cuatro.
Quieres que tu sitio aparezca en las solicitudesresultados del motor de búsqueda? Luego debe ser procesado por Rambler, Yandex, Google, Yahoo y así sucesivamente. Debe informar a los motores de búsqueda (arañas, sistemas) sobre la existencia de su sitio web, y luego lo analizarán en su totalidad o en parte.
Muchos sitios no están indexados en los últimos años. La información que está en ellos no es vista por nadie, excepto por sus propietarios.
Formas de procesamiento
La indexación del sitio se puede hacer de varias maneras:
- La primera opción es añadir manual. Debe ingresar los datos de su sitio a través de los formularios especiales ofrecidos por los motores de búsqueda.
- En el segundo caso, el propio motor de búsqueda robot.Encuentra tu sitio web por referencia y lo indexa. Él puede encontrar su sitio a través de enlaces de otros recursos que conducen a su proyecto. Este método es el más efectivo. Si el motor de búsqueda encuentra el sitio de esta manera, lo considera significativo.
Tiempo
La indexación del sitio no es demasiado rápida. Los términos son diferentes, desde 1-2 semanas. Los enlaces de recursos autorizados (con excelentes relaciones públicas y tetas) aceleran significativamente la ubicación del sitio en la base de datos de los motores de búsqueda. Hoy en día, el más lento es Google, aunque hasta el 2012 podría hacer este trabajo durante la semana. Desafortunadamente, todo está cambiando muy rápidamente. Se sabe que Mail.ru trabaja con sitios web en esta área durante aproximadamente seis meses.
Indexación del sitio en buscadores para implementar.No todos los especialistas son capaces. El tiempo de adición a la base de datos de las nuevas páginas ya procesadas por el sitio de los motores de búsqueda afecta la frecuencia de ajuste de su contenido. Si constantemente aparece información nueva en el recurso, el sistema considera que se actualiza con frecuencia y es útil para las personas. En este caso, su trabajo se acelera.
Puede seguir el progreso de indexar un sitio web en secciones especiales para webmasters o en motores de búsqueda.
Cambios
Por lo tanto, ya hemos descubierto cómo irindexación del sitio. Cabe señalar que las bases de datos de motores de búsqueda se actualizan con frecuencia. Por lo tanto, la cantidad de páginas agregadas a ellos en su proyecto puede cambiar (disminuir y aumentar) por las siguientes razones:
- motor de búsqueda de sanciones al sitio web;
- presencia de errores en el sitio;
- cambio de algoritmos de motores de búsqueda;
- alojamiento asqueroso (inaccesibilidad del servidor en el que se encuentra el proyecto), etc.
Respuestas "Yandex" a preguntas ordinarias
Yandex es un motor de búsqueda utilizadomuchos usuarios Ocupa el quinto lugar entre los sistemas de búsqueda en el mundo en términos del número de solicitudes de investigación procesadas. Si le agrega un sitio, puede agregarse a la base de datos durante demasiado tiempo.
Agregar una URL no garantiza su indexación. Este es solo uno de los métodos mediante los cuales se informa al robot del sistema que ha aparecido un nuevo recurso. Si no hay enlaces al sitio desde otros sitios web o algunos de ellos, la adición ayudará a encontrarlo más rápido.
Si no se produjo la indexación, debe verificar, no¿Hubo una falla en el servidor en el momento de la creación de la aplicación del robot "Yandex"? Si el servidor informa un error, el robot terminará su trabajo e intentará realizarlo como un tutorial completo. Los empleados de Yandex no pueden aumentar la velocidad de agregar páginas a la base del motor de búsqueda.
Indexar un sitio en Yandex es bastanteocupacion dificil ¿No sabes cómo agregar un recurso a un motor de búsqueda? Si tiene enlaces de otros sitios web, no es necesario que agregue un sitio web especial: el robot lo buscará automáticamente y lo indexará. Si no tiene dichos enlaces, puede usar el formulario "Agregar URL" para declarar al motor de búsqueda que existe un sitio web.
Debe recordarse que agregar una URL no garantiza la indexación de su creación (o su velocidad).
Muchos se preguntan cuánto tiempo llevaIndización del sitio en Yandex. Los empleados de esta empresa no dan garantías y no predicen fechas. Como regla general, desde que el robot descubrió el sitio, sus páginas de búsqueda aparecen en dos días, a veces en un par de semanas.
Proceso de procesamiento
Yandex es un motor de búsqueda que requiere precisión y atención. La indexación del sitio consta de tres partes:
- El robot de búsqueda rastrea las páginas de recursos.
- El contenido (contenido) del sitio se registra en el sistema de búsqueda de base de datos (índice).
- Después de 2-4 semanas, después de actualizar la base de datos, puede ver los resultados. Su sitio aparecerá (o no aparecerá) en los resultados de búsqueda.
Verificación de indexación
¿Cómo comprobar la indexación del sitio? Puedes hacerlo de tres maneras:
- Introduzca el nombre de su empresa en la línea.busque (por ejemplo, "Yandex") y verifique cada enlace en la primera y segunda página. Si encuentra la URL de su creación allí, significa que el robot ha completado su tarea.
- Puede ingresar la URL de su sitio en la línea de búsqueda. Puede ver cuántas listas de Internet se muestran, es decir, indexadas.
- Regístrate en las páginas webmaster enMail.ru, Google, Yandex. Después de pasar la verificación del sitio, podrá ver los resultados de la indexación y otros servicios de motores de búsqueda creados para mejorar el rendimiento de su recurso.
¿Por qué se niega Yandex?
La indexación del sitio en Google se lleva a cabo.de la siguiente manera: el robot en la base de datos ingresa a todas las páginas del sitio, de baja calidad y calidad, sin elegir Pero solo los documentos útiles están involucrados en el ranking. Un "Yandex" excluye toda la basura web inmediatamente. Puede indexar cualquier página, pero el motor de búsqueda eventualmente eliminará toda la basura.
Ambos sistemas tienen un índice incremental. Tanto eso como las otras páginas de baja calidad afectan la calificación general del sitio web. Emplea una filosofía simple. Los recursos favoritos de un usuario en particular ocuparán posiciones más altas en su emisión. Pero este mismo individuo difícilmente encontrará un sitio que no le haya gustado la última vez.
Es por eso que primero es necesario cubrir las copias de los documentos web de la indexación, inspeccionar la presencia de páginas vacías y no permitir que se publique contenido de baja calidad.
Aceleración de Yandex
¿Cómo puede acelerar la indexación del sitio en "Yandex"? Se requieren los siguientes pasos:
- Instale el navegador Yandex en su computadora y navegue por las páginas del sitio que lo usa.
- Confirme los derechos para administrar el recurso en Yandex.Webmaster.
- En Twitter publica un enlace al artículo. Se sabe que desde 2012, Yandex colabora con esta empresa.
- Para el sitio agregar una búsqueda de Yandex. En la sección "Indexación" puede especificar sus propias URL.
- Ingrese el código "Yandex.Metrica" sin especificar la marca de verificación "El envío de páginas para indexación está prohibido".
- Hacer un Sitemap que existaSolo para el robot y no visible para el público. El cheque comenzará con él. La dirección del mapa del sitio se ingresa en robots.txt o en una forma adecuada en "Webmaster" - "Configuración de indexación" - "Sitemaps".
Acciones intermedias
Lo que debes hacer mientras la página web"Yandex" no está indexado? Motor de búsqueda nacional debe considerar el sitio la fuente original. Por eso, incluso antes de la publicación del artículo, es necesario agregar su contenido al formulario "Textos específicos". De lo contrario, los plagiales copiarán el registro a su recurso y estarán primero en la base de datos. Como resultado, serán reconocidos por los autores.
Base de datos de Google
Para Google, las mismas recomendaciones que describimos anteriormente son adecuadas, solo los servicios serán diferentes:
- Google+ (en lugar de Twitter);
- Google Chrome
- Dispositivos Google para programadores - "Escanear" - "Parecer a Googlebot" - Opción "Escanear" - Opción "Agregar al índice";
- Buscar dentro del recurso de Google;
- Google Analytics (en lugar de Yandex.Metrics).
Prohibicion
¿Qué es la prohibición de indexación?sitio? Puede imponerlo tanto en toda la página como en su parte separada (enlace o parte del texto). De hecho, existe tanto una prohibición global de la indexación como una local. ¿Cómo se implementa esto?
Considere la prohibición de agregar un sitio web a la base del motor de búsqueda en Robots.txt. Al usar el archivo robots.txt, puede excluir la indexación de una sola página o un encabezado de recursos completo como este:
- Usuario-agente: *
- No permitir: /kolobok.html
- No permitir: / foto /
El primer párrafo dice que las instrucciones.definido para todos los PS, el segundo indica la prohibición de indexar el archivo kolobok.html, y el tercero, no permite agregar todo el relleno de la carpeta de fotos a la base de datos. Si necesita excluir varias páginas o carpetas, especifíquelas todas en “Robots”.
Para evitar la indexación.Una lista en línea separada, puede aplicar la metaetiqueta de robots. Difiere de robots.txt en que da instrucciones a todos los PS a la vez. Esta etiqueta meta está sujeta a los principios generales del formato html. Debe colocarse en el encabezado de la página entre las etiquetas <head> <head>. Una entrada para una prohibición, por ejemplo, puede escribirse así: <meta name = "robots" content = "noindex, nofollow">.
Ajax
¿Cómo indexa Yandex los sitios Ajax? Hoy en día, muchos desarrolladores de sitios web utilizan la tecnología Ajax. Por supuesto, ella tiene grandes oportunidades. Con él, puede crear páginas web interactivas de alta velocidad y productivas.
Sin embargo, el robot del motor de búsqueda ve la lista web.No me gusta el usuario y el navegador. Por ejemplo, una persona ve una interfaz cómoda con las listas de Internet móvil. Para un robot de búsqueda, el contenido de la misma página puede estar vacío o presentarse como el resto del contenido HTML estático, para cuya generación no funcionan los scripts.
Puedes usar URLs con # para crear sitios Ajax,Pero su motor de búsqueda robot no utiliza. Por lo general, la parte de la URL después de # se separa. Esto debe tenerse en cuenta. Por lo tanto, en lugar de la URL del formulario http://site.ru/#example, hace una aplicación a la página principal del recurso, ubicada en http://site.ru. Esto significa que el contenido de la hoja de Internet puede no estar incluido en la base de datos. Como resultado, no aparecerá en los resultados de búsqueda.
Mejorar la indexación de los sitios Ajax.Yandex admitió cambios en el motor de búsqueda y reglas de procesamiento de URL para dichos sitios web. Hoy en día, los webmasters pueden indicar al motor de búsqueda Yandex la necesidad de indexación creando el esquema apropiado en la estructura de recursos. Para esto necesitas:
- Reemplace # en la URL de la página con #!. Ahora el robot comprenderá que podrá solicitar la versión HTML del contenido de esta hoja de Internet.
- La versión HTML del contenido de dicha página debe colocarse en la URL, donde #! reemplazado por? _escaped_fragment_ =. </ ol </ p>