Presupuesto de rastreo explicado

Presupuesto de rastreo en breve

El presupuesto de rastreo es el número de páginas que los motores de búsqueda rastrearán en un sitio web dentro de un período de tiempo determinado.

Los motores de búsqueda calculan el presupuesto de rastreo en función del límite de rastreo (con qué frecuencia pueden rastrear sin causar problemas) y la demanda de rastreo (con qué frecuencia les gustaría rastrear un sitio).

Si estás desperdiciando el presupuesto de rastreo, los motores de búsqueda no podrán rastrear tu sitio web de manera eficiente, lo que terminaría perjudicando tu rendimiento SEO.

¿Qué es el presupuesto de rastreo?

El presupuesto de rastreo es el número de páginas que los motores de búsqueda rastrearán en un sitio web dentro de un período de tiempo determinado.

¿Por qué los motores de búsqueda asignan un presupuesto de rastreo a los sitios web?

Porque no tienen recursos ilimitados y dividen su atención en millones de sitios web. Por lo tanto, necesitan una forma de priorizar su esfuerzo de rastreo. Asignar un presupuesto de rastreo a cada sitio web les ayuda a hacer esto.

¿Cómo asignan el presupuesto de rastreo a los sitios web?

Eso se basa en dos factores, límite de rastreo y demanda de rastreo:

  1. Límite de rastreo / carga de host: ¿cuánto rastreo puede manejar un sitio web y cuáles son las preferencias de su propietario?
  2. Programación de rastreo por demanda / rastreo: qué URLs son las que más vale (re)rastrear, según su popularidad y la frecuencia con la que se actualizan.

El presupuesto de rastreo es un término común dentro del SEO. El presupuesto de rastreo a veces también se conoce como espacio de rastreo o tiempo de rastreo.

 Presupuesto de rastreo

¿El presupuesto de rastreo es solo sobre páginas?

En realidad no es, por el bien de la facilidad, estamos hablando de páginas, pero en realidad se trata de cualquier documento que rastreen los motores de búsqueda. Algunos ejemplos de otros documentos: archivos JavaScript y CSS, variantes de páginas móviles, variantes hreflang y archivos PDF.

¿Cómo funciona el límite de rastreo / carga de host en la práctica?

El límite de rastreo, o la carga del host, es una parte importante del presupuesto de rastreo. Los rastreadores de motores de búsqueda están diseñados para evitar sobrecargar un servidor web con solicitudes, por lo que son cuidadosos con esto.¿Cómo determinan los motores de búsqueda el límite de rastreo de un sitio web? Hay una variedad de factores que influyen en el límite de rastreo. Por nombrar algunos:

  • Señales de que la plataforma está en mal estado: con qué frecuencia se solicita el tiempo de espera de las URL o se devuelven errores del servidor.
  • La cantidad de sitios web que se ejecutan en el host: si su sitio web se ejecuta en una plataforma de alojamiento compartido con cientos de otros sitios web, y tiene un sitio web bastante grande, el límite de rastreo para su sitio web es muy limitado, ya que el límite de rastreo se determina a nivel de host. Tienes que compartir el límite de rastreo del host con todos los otros sitios que se ejecutan en él. En este caso, estaría mucho mejor en un servidor dedicado, lo que probablemente también disminuirá masivamente los tiempos de carga para sus visitantes.

Otra cosa a considerar es tener sitios móviles y de escritorio separados que se ejecuten en el mismo host. También tienen un límite de rastreo compartido. Así que ten esto en cuenta.

Gaste sabiamente su presupuesto de rastreo

¿Los motores de búsqueda rastrean las partes más importantes de su sitio web? Ejecutar una prueba rápida con ContentKing!

¿Cómo funciona la programación de la demanda de rastreo / rastreo en la práctica?

La demanda de rastreo, o programación de rastreo, se trata de determinar el valor de volver a rastrear las URL. Una vez más, muchos factores influyen en la demanda de rastreo, entre los cuales:

  • Popularidad: cuántos enlaces internos y externos entrantes tiene una URL, pero también la cantidad de consultas para las que se clasifica.
  • Frescura: con qué frecuencia se actualiza la URL.
  • Tipo de página: es el tipo de página que puede cambiar. Tomemos, por ejemplo, una página de categoría de producto y una página de términos y condiciones, ¿cuál cree que cambia más a menudo y merece ser rastreado con más frecuencia?
Dawn Anderson

Forzar a los rastreadores de Google a regresar a tu sitio cuando no hay nada más importante que encontrar (es decir, un cambio significativo) no es una buena estrategia y son bastante inteligentes para determinar si la frecuencia de cambio de estas páginas realmente agrega valor. El mejor consejo que podría dar es concentrarme en hacer que las páginas sean más importantes (agregar más información útil, hacer que el contenido de las páginas sea rico (naturalmente desencadenarán más consultas de forma predeterminada, siempre y cuando se mantenga el enfoque de un tema). Al activar de forma natural más consultas como parte de ‘recall’ (impresiones), haces que tus páginas sean más importantes y, de repente, es probable que te rastreen con más frecuencia.

Dawn Anderson, Bertey (se abre en una pestaña nueva)

No olvides: capacidad de rastreo del sistema en sí

Mientras que los sistemas de rastreo de motores de búsqueda tienen una capacidad de rastreo masiva, al final del día es limitada. Por lo tanto, en un escenario en el que el 80% de los centros de datos de Google se desconectan al mismo tiempo, su capacidad de rastreo disminuye enormemente y, a su vez, el presupuesto de rastreo de todos los sitios web.

¡Muchísimas gracias a Dawn Anderson (se abre en una pestaña nueva) por proporcionarnos detalles sobre el límite de rastreo, la demanda de rastreo y la capacidad de rastreo!

¿Por qué debería preocuparse por el presupuesto de rastreo?

Desea que los motores de búsqueda encuentren y comprendan la mayor cantidad posible de sus páginas indexables, y desea que lo hagan lo antes posible. Cuando agregas nuevas páginas y actualizas las existentes, quieres que los motores de búsqueda las recojan lo antes posible. Cuanto antes indexen las páginas, antes podrás beneficiarte de ellas.

Si estás desperdiciando el presupuesto de rastreo, los motores de búsqueda no podrán rastrear tu sitio web de manera eficiente. Pasarán tiempo en partes de tu sitio que no importan, lo que puede resultar en que partes importantes de tu sitio web no se descubran. Si no conocen las páginas, no las rastrearán ni indexarán, y no podrás atraer visitantes a través de los motores de búsqueda.

Puedes ver a dónde lleva esto: desperdiciar el presupuesto de rastreo perjudica tu rendimiento SEO.

Tenga en cuenta que el presupuesto de rastreo generalmente es solo algo de lo que preocuparse si tiene un sitio web grande, digamos de 10,000 páginas y más.

Barry Adams

Uno de los aspectos menos apreciados del presupuesto de rastreo es la velocidad de carga. Un sitio web de carga más rápida significa que Google puede rastrear más URL en la misma cantidad de tiempo. Recientemente estuve involucrado con una actualización del sitio donde la velocidad de carga era un enfoque importante. El nuevo sitio se cargó el doble de rápido que el anterior. Cuando se publicó en vivo, el número de URL rastreadas por Google al día aumentó de 150,000 a 600,000, y se mantuvo allí. Para un sitio de este tamaño y alcance, la tasa de rastreo mejorada significa que el contenido nuevo y modificado se rastrea mucho más rápido, y vemos un impacto mucho más rápido de nuestros esfuerzos de SEO en las SERPs.

Barry Adams, Consultor SEO independiente, Polemic Digital (se abre en una pestaña nueva)

Cyrus Shepard

Un SEO muy sabio (está bien, fue AJ Kohn (se abre en una pestaña nueva)) dijo una vez: «Eres lo que come el Googlebot.». Tus rankings y visibilidad de búsqueda están directamente relacionados no solo con lo que Google rastrea en tu sitio, sino con frecuencia, con qué frecuencia lo rastrean. Si Google pierde contenido en tu sitio, o no rastrea las URL importantes con la frecuencia suficiente debido a un presupuesto de rastreo limitado/no optimizado, entonces te costará mucho clasificarte. Para sitios más grandes, optimizar el presupuesto de rastreo puede elevar en gran medida el perfil de páginas previamente invisibles. Mientras que el sitio más pequeño necesita preocuparse menos por el presupuesto de rastreo, los mismos principios de optimización (velocidad, priorización, estructura de enlaces, desduplicación, etc.).) todavía puede ayudarte a posicionarte.

LinkedIn (se abre en una pestaña nueva)Cyrus Shepard, Zyppy (se abre en una pestaña nueva)

Paul Shapiro

En su mayoría estoy de acuerdo con Google y, en su mayor parte, muchos sitios web no tienen que preocuparse por el presupuesto de rastreo. Pero para los sitios web de gran tamaño y, especialmente, los que se actualizan con frecuencia, como los editores, la optimización puede marcar una diferencia significativa.

Paul Shapiro, Director Global, SEO Técnico, Condé Nast (se abre en una pestaña nueva)

¿Cuál es el presupuesto de rastreo de mi sitio web?

De todos los motores de búsqueda, Google es el más transparente sobre su presupuesto de rastreo para su sitio web.

Presupuesto de rastreo en Google Search Console

Si has verificado tu sitio web en Google Search Console, puedes obtener información sobre el presupuesto de rastreo de tu sitio web para Google.

Siga estos pasos:

  1. Inicia sesión en Google Search Console y elige un sitio web.
  2. Ir a Crawl > Crawl Stats. Allí puedes ver el número de páginas que Google rastrea por día.

Durante el verano de 2016, nuestro presupuesto de rastreo se veía así:

Estadísticas de rastreo de la Consola de Búsqueda de Google
Estadísticas de rastreo de la Consola de Búsqueda de Google – Verano 2016

Vemos aquí que el presupuesto promedio de rastreo es de 27 páginas / día. Así que, en teoría, si este presupuesto de rastreo promedio se mantiene igual, tendrías un presupuesto de rastreo mensual de 27 páginas x 30 días = 810 páginas.

Avance rápido 2 años, y mira cuál es nuestro presupuesto de rastreo ahora mismo:

Estadísticas de rastreo de la Consola de Búsqueda de Google
Estadísticas de rastreo de la Consola de Búsqueda de Google – Verano 2018

Nuestro presupuesto de rastreo promedio es de 253 páginas / día, por lo que se podría decir que nuestro presupuesto de rastreo aumentó 10 veces en 2 años.

Vaya a la fuente: registros del servidor

Es muy interesante revisar los registros de su servidor para ver la frecuencia con la que los rastreadores de Google visitan su sitio web. Es interesante comparar estas estadísticas con las que se reportan en la Consola de búsqueda de Google. Siempre es mejor confiar en múltiples fuentes.

Presupuesto de rastreo optimizado = Más tráfico orgánico

No dejes que los problemas de rastreo sean una oportunidad perdida. Supervise continuamente su sitio con ContentKing y reciba alertas de problemas en tiempo real.

¿Cómo optimizar su presupuesto de rastreo?

Optimizar tu presupuesto de rastreo se reduce a asegurarte de que no se desperdicie ningún presupuesto de rastreo. Esencialmente, arreglar las razones del presupuesto de rastreo desperdiciado. Monitorizamos miles de sitios web; si revisaras cada uno de ellos por problemas de presupuesto de rastreo, verías rápidamente un patrón: la mayoría de los sitios web sufren el mismo tipo de problemas.

Razones comunes para desperdiciar el presupuesto de rastreo que encontramos:

  1. URL accesibles con parámetros: un ejemplo de URL con un parámetro es https://www.example.com/toys/cars?color=black. En este caso, el parámetro se utiliza para almacenar la selección de un visitante en un filtro de producto.
  2. Contenido duplicado: llamamos a las páginas que son muy similares, o exactamente iguales, «contenido duplicado».»Los ejemplos son: páginas copiadas, páginas de resultados de búsqueda interna y páginas de etiquetas.
  3. Contenido de baja calidad: páginas con muy poco contenido o páginas que no agregan ningún valor.
  4. Enlaces rotos y de redirección: los enlaces rotos son enlaces que hacen referencia a páginas que ya no existen, y los enlaces redirigidos son enlaces a URL que redirigen a otras URL.
  5. Incluir direcciones URL incorrectas en mapas de sitio XML: las páginas no indexables y las que no son páginas, como las direcciones URL 3xx, 4xx y 5xx, no deben incluirse en el mapa de sitio XML.
  6. Páginas con alto tiempo de carga / tiempos de espera: las páginas que tardan mucho tiempo en cargarse, o que no se cargan en absoluto, tienen un impacto negativo en tu presupuesto de rastreo, porque es una señal para los motores de búsqueda de que tu sitio web no puede manejar la solicitud, por lo que pueden ajustar tu límite de rastreo.
  7. Alto número de páginas no indexables: el sitio web contiene muchas páginas que no son indexables.
  8. Mala estructura de enlaces internos: si tu estructura de enlaces internos no está configurada correctamente, es posible que los motores de búsqueda no presten suficiente atención a algunas de tus páginas.
Jenny Halasz

a menudo he dicho que Google es como su jefe. No irías a una reunión con tu jefe a menos que supieras de qué ibas a hablar, los aspectos más destacados de tu trabajo, los objetivos de tu reunión. En resumen, tendrás una agenda. Cuando entras en la «oficina» de Google, necesitas lo mismo. Una jerarquía de sitios clara sin mucho trabajo, un mapa de sitio XML útil y tiempos de respuesta rápidos ayudarán a Google a llegar a lo que es importante. No pases por alto este elemento a menudo mal entendido del SEO.

Jenny Halasz, consultora de marketing de búsqueda, Marketing de JLH (se abre en una pestaña nueva)

Kevin Indig

Para mí, el concepto de presupuesto de rastreo es uno de los puntos clave del SEO técnico. Cuando optimizas el presupuesto de rastreo, todo lo demás encaja en su lugar: enlaces internos, corrección de errores, velocidad de página, optimización de URL, contenido de baja calidad y más. Las personas deberían indagar en sus archivos de registro con más frecuencia para monitorear el presupuesto de rastreo de URL específicas, subdominios, directorios, etc. La frecuencia de rastreo de monitoreo está muy relacionada con el presupuesto de rastreo y es súper poderosa.

LinkedIn (se abre en una pestaña nueva)Kevin Indig (se abre en una pestaña nueva), Director de SEO, Shopify (se abre en una pestaña nueva)

URL accesibles con parámetros

En la mayoría de los casos, las URL con parámetros no deberían ser accesibles para los motores de búsqueda, ya que pueden generar una cantidad virtualmente infinita de URL.Hemos escrito extensamente sobre este tipo de problema en nuestro artículo sobre trampas de rastreo.

Las URL con parámetros se utilizan comúnmente al implementar filtros de productos en sitios de comercio electrónico. Está bien usarlos, solo asegúrate de que no sean accesibles para los motores de búsqueda.

¿Cómo puedes hacerlos inaccesibles para los motores de búsqueda?

  1. Utilice sus robots.archivo txt para indicar a los motores de búsqueda que no accedan a dichas URL. Si no es una opción por algún motivo, usa la configuración de manejo de parámetros de URL en Google Search Console y Bing Webmaster Tools para indicar a Google y Bing qué páginas no rastrear.
  2. Agregue el valor del atributo nofollow a los enlaces en los enlaces de filtro. Ten en cuenta que a partir de marzo de 2020, Google puede optar por ignorar el nofollow. Por lo tanto, el paso 1 es aún más importante.

Contenido duplicado

No quieres que el motor de búsqueda invierta su tiempo en páginas de contenido duplicado, por lo que es importante evitar, o al menos minimizar, el contenido duplicado en tu sitio.

¿Cómo se hace esto? Por…

  1. Configuración de redirecciones de sitios web para todas las variantes de dominio(HTTP, HTTPS, non-WWW, y WWW).
  2. Hacer que las páginas de resultados de búsqueda internas sean inaccesibles para los motores de búsqueda que usan sus robots.txt. He aquí un ejemplo de robots.txt para un sitio web de WordPress.
  3. Deshabilitar páginas dedicadas para imágenes (por ejemplo: las infames páginas de adjuntos de imágenes en WordPress).
  4. Tener cuidado con el uso de taxonomías como categorías y etiquetas.

Echa un vistazo a algunas razones más técnicas para el contenido duplicado y cómo solucionarlas.

Contenido de baja calidad

Las páginas con muy poco contenido no son interesantes para los motores de búsqueda. Manténgalos al mínimo, o evítelos por completo si es posible. Un ejemplo de contenido de baja calidad es una sección de preguntas frecuentes con enlaces para mostrar las preguntas y respuestas, donde cada pregunta y respuesta se sirve en una URL separada.

Enlaces rotos y redireccionados

Los enlaces rotos y las largas cadenas de redirecciones son callejones sin salida para los motores de búsqueda. Al igual que los navegadores, Google parece seguir un máximo de cinco redirecciones encadenadas en un solo rastreo (pueden volver a rastrearlo más tarde). No está claro qué tan bien lidian otros motores de búsqueda con los redireccionamientos posteriores, pero le recomendamos encarecidamente que evite los redireccionamientos encadenados por completo y mantenga el uso de los redireccionamientos al mínimo.

Está claro que al arreglar enlaces rotos y redirigir enlaces, puedes recuperar rápidamente el presupuesto de rastreo desperdiciado. Además de recuperar el presupuesto de rastreo, también estás mejorando significativamente la experiencia de usuario de un visitante. Las redirecciones, y las cadenas de redirecciones en particular, causan un mayor tiempo de carga de la página y, por lo tanto, perjudican la experiencia del usuario.

Para facilitar la búsqueda de enlaces rotos y la redirección, hemos dedicado números especiales a esto dentro de ContentKing.

Vaya a Issues > Links para averiguar si está malgastando los presupuestos de rastreo debido a enlaces defectuosos. Actualice cada enlace para que se vincule a una página indexable, o elimine el enlace si ya no es necesario.

Enlaces rotos y de redirección en ContentKing
Enlaces rotos y de redirección en ContentKing

Url incorrectas en mapas de sitio XML

Todas las URL incluidas en mapas de sitio XML deben ser para páginas indexables. Especialmente con sitios web grandes, los motores de búsqueda dependen en gran medida de mapas de sitio XML para encontrar todas sus páginas. Si tus mapas de sitio XML están repletos de páginas que, por ejemplo, ya no existen o se están redirigiendo, estás desperdiciando el presupuesto de rastreo. Revisa regularmente tu mapa de sitio XML para ver si hay URL no indexables que no pertenezcan allí. Compruebe también lo contrario: busque páginas que estén excluidas incorrectamente del mapa de sitio XML. El mapa de sitio XML es una excelente manera de ayudar a los motores de búsqueda a gastar sabiamente el presupuesto de rastreo.

Consola de búsqueda de Google

Cómo encontrar informes sobre problemas de mapa de sitio XML en GSC:
  1. Inicie sesión en Google Search Console
  2. Haga clic en la pestaña Crawl
  3. Haga clic en la pestaña Sitemaps
Errores de mapa de sitio XML en Google Search Console
Errores de mapa de sitio XML en Google Search Console

Bing Webmaster Tools

Cómo encontrar informes sobre problemas de mapa de sitio XML en Bing:
  1. Inicie sesión en su cuenta de Bing Webmaster Tools
  2. Haga clic en la pestaña Configure My Site
  3. Haga clic en la pestaña Sitemaps

ContentKing

Cómo encontrar informes sobre problemas de mapa de sitio XML usando ContentKing:
  1. Inicie sesión en su cuenta de ContentKing
  2. Haga clic en el botón Issues
  3. Haga clic en el botón XML Sitemap
  4. En caso de problemas con su página, recibirá este mensaje: Page is incorrectly included in XML sitemap
Problema con el sitemap XML en ContentKing
Problema con el sitemap XML en ContentKing

Una práctica recomendada para la optimización del presupuesto de rastreo es dividir los mapas de sitio XML en mapas de sitio más pequeños. Por ejemplo, puede crear mapas de sitio XML para cada una de las secciones de su sitio web. Si has hecho esto, puedes determinar rápidamente si hay algún problema en ciertas secciones de tu sitio web.

Digamos que tu mapa de sitio XML para la sección A contiene 500 enlaces y 480 están indexados: entonces lo estás haciendo bastante bien. Pero si su mapa de sitio XML para la sección B contiene 500 enlaces y solo 120 están indexados, eso es algo que debe investigarse. Es posible que haya incluido muchas URL no indexables en el mapa del sitio XML de la sección B.

¿Su sitio web está desperdiciando el presupuesto de rastreo?

Las malas condiciones para los rastreadores pueden dañar tu SEO. Usa ContentKing para realizar una auditoría rápida de tu sitio web.

Páginas con tiempos de carga / tiempos de espera altos

Presupuesto de rastreo: páginas con tiempos de carga o tiempos de espera altos
Las páginas con tiempos de carga o tiempos de espera altos dañan el proceso de rastreo

Cuando las páginas tienen tiempos de carga o tiempo de espera altos, los motores de búsqueda pueden visitar menos páginas dentro de su presupuesto de rastreo asignado para su sitio web. Además de ese inconveniente, los altos tiempos de carga de páginas y los tiempos de espera perjudican significativamente la experiencia de usuario de su visitante, lo que resulta en una tasa de conversión más baja.

Los tiempos de carga de páginas superiores a dos segundos son un problema. Idealmente, tu página se cargará en menos de un segundo. Verifique regularmente los tiempos de carga de su página con herramientas como Pingdom (se abre en una pestaña nueva), WebPageTest (se abre en una pestaña nueva) o GTmetrix (se abre en una pestaña nueva).

Google informa sobre el tiempo de carga de la página en ambos Google Analytics (en Behavior > Site Speed) y Google Search Console en Crawl > Crawl Stats.

La Consola de búsqueda de Google y las herramientas para Webmasters de Bing informan sobre los tiempos de espera de las páginas. En la Consola de búsqueda de Google, esto se puede encontrar en Crawl > Crawl Errors, y en Bing Webmaster Tools, está bajo Reports & Data > Crawl Information.

Verifique regularmente si sus páginas se cargan lo suficientemente rápido y tome medidas de inmediato si no lo están. Las páginas de carga rápida son vitales para su éxito en línea.

Recursos útiles

Alto número de páginas no indexables

Si su sitio web contiene un alto número de páginas no indexables que son accesibles para los motores de búsqueda, básicamente está manteniendo a los motores de búsqueda ocupados revisando páginas irrelevantes.

Consideramos que los siguientes tipos son páginas no indexables:

  • Redirecciona (3xx)
  • Páginas que no se pueden encontrar (4xx)
  • Páginas con errores de servidor (5xx)
  • Páginas que no son indexables (páginas que contienen la directiva robots noindex o URL canónica)

Para averiguar si tienes un gran número de páginas no indexables, busca el número total de páginas que los rastreadores han encontrado dentro de tu sitio web y cómo se descomponen. Puedes hacerlo fácilmente usando ContentKing:

Desglose de URL en ContentKing
Desglose de URL en ContentKing

En este ejemplo, se han encontrado 63.137 URL, de las cuales solo 20.528 son páginas.

Desglose de indexabilidad de páginas en ContentKing
Desglose de indexabilidad de páginas en ContentKing

Y de estas páginas, solo 4663 son indexables para motores de búsqueda. Solo el 7,4% de las URL encontradas por ContentKing pueden ser indexadas por los motores de búsqueda. Esa no es una buena proporción, y este sitio web definitivamente necesita trabajar en eso limpiando todas las referencias a ellos que sean innecesarias, incluidas:

  • El mapa del sitio XML (consulte la sección anterior)
  • Enlaces
  • URLs canónicas
  • Referencias Hreflang
  • Referencias de paginación (enlace rel anterior / siguiente)

Mala estructura de enlaces internos

Cómo las páginas de tu sitio web enlazan entre sí juega un papel importante en la optimización del presupuesto de rastreo. A esto lo llamamos la estructura de enlaces internos de su sitio web. Dejando de lado los backlinks, las páginas que tienen pocos enlaces internos reciben mucha menos atención de los motores de búsqueda que las páginas a las que muchas páginas enlazan.

Evite una estructura de enlaces muy jerárquica, con páginas en el medio que tengan pocos enlaces. En muchos casos, estas páginas no se rastrearán con frecuencia. Es aún peor para las páginas en la parte inferior de la jerarquía: debido a su limitada cantidad de enlaces, es muy posible que los motores de búsqueda las descuiden.

Asegúrate de que tus páginas más importantes tengan muchos enlaces internos. Las páginas que se han rastreado recientemente suelen clasificarse mejor en los motores de búsqueda. Ten esto en cuenta y ajusta tu estructura de enlaces internos para ello.

Por ejemplo, si tienes un artículo de blog que data de 2011 y genera mucho tráfico orgánico, asegúrate de seguir enlazándolo desde otro contenido. Debido a que has producido muchos otros artículos de blog a lo largo de los años, ese artículo de 2011 se está empujando automáticamente hacia abajo en la estructura de enlaces internos de tu sitio web.

Patrick Stox

Por lo general, no tienes que preocuparte por la tasa de rastreo de tus páginas importantes. Por lo general, son páginas que son nuevas, a las que no enlazaste, y a las que la gente no va, que pueden no ser rastreadas a menudo.

LinkedIn (se abre en una pestaña nueva)Patrick Stox, SEO técnico basado en Raleigh (se abre en una pestaña nueva)

¿Cómo aumentas el presupuesto de rastreo de tu sitio web?

Durante una entrevista (se abre en una pestaña nueva) entre Eric Enge y el ex jefe del equipo de webspam de Google, Matt Cutts, se planteó la relación entre autoridad y presupuesto de rastreo:

Matt Cutts

La mejor manera de pensarlo es que el número de páginas que rastreamos es aproximadamente proporcional a tu PageRank. Así que si tienes muchos enlaces entrantes en tu página raíz, definitivamente rastrearemos eso. Entonces tu página raíz puede enlazar a otras páginas, y esas obtendrán PageRank y nosotros las rastrearemos también. Sin embargo, a medida que te adentras más y más en tu sitio, el PageRank tiende a declinar.

Matt Cutts

A pesar de que Google ha abandonado la actualización de los valores de PageRank de las páginas públicamente, creemos que (una forma de) PageRank todavía se usa en sus algoritmos. Dado que PageRank es un término incomprendido y confuso, llamémoslo autoridad de página. Lo que quiero decir aquí es que Matt Cutts básicamente dice: hay una relación bastante fuerte entre la autoridad de la página y el presupuesto de rastreo.

Por lo tanto, para aumentar el presupuesto de rastreo de tu sitio web, necesitas aumentar la autoridad de tu sitio web. Una gran parte de esto se hace ganando más enlaces de sitios web externos. Puede encontrar más información sobre esto en nuestra guía de construcción de enlaces.

Ross Tavendale

Cuando escucho a la industria hablar sobre el presupuesto de rastreo, generalmente hablamos de los cambios técnicos y en la página que podemos hacer para aumentar el presupuesto de rastreo con el tiempo. Sin embargo, viniendo de un fondo de construcción de enlaces, los picos más grandes en las páginas rastreadas que vemos en la Consola de búsqueda de Google se relacionan directamente con cuando ganamos grandes enlaces para nuestros clientes.

LinkedIn (se abre en una pestaña nueva)Ross Tavendale, Escriba un medio (se abre en una pestaña nueva)

Preguntas frecuentes sobre el presupuesto de rastreo

  1. 🧾 ¿Qué es el presupuesto de rastreo?
  2. ? ¿Cómo aumento mi presupuesto de rastreo?
  3. ️ ️ ¿Qué puede limitar mi presupuesto de rastreo?
  4. Should ¿Debería usar URL canónica y meta robots?

1. What ¿Qué es el presupuesto de rastreo?

El presupuesto de rastreo es el número de páginas que los motores de búsqueda rastrearán en un sitio web dentro de un período de tiempo determinado.

2. increase ¿Cómo puedo aumentar mi presupuesto de rastreo?

Google ha indicado que hay una fuerte relación entre la autoridad de la página y el presupuesto de rastreo. Cuanta más autoridad tenga una página, más presupuesto de rastreo tendrá. En pocas palabras, para aumentar tu presupuesto de rastreo, construye la autoridad de tu página.

3. What ¿Qué puede limitar mi presupuesto de rastreo?

El límite de rastreo, también conocido como carga de rastreo de host, se basa en muchos factores, como el estado del sitio web y las capacidades de alojamiento. Los rastreadores de motores de búsqueda están configurados para evitar la sobrecarga de un servidor web. Si tu sitio web devuelve errores de servidor, o si las URL solicitadas se agotan con frecuencia, el presupuesto de rastreo será más limitado. Del mismo modo, si su sitio web se ejecuta en una plataforma de alojamiento compartido, el límite de rastreo será mayor, ya que debe compartir su presupuesto de rastreo con otros sitios web que se ejecutan en el alojamiento.

4. Should ¿Debería usar robots de URL canónicos y meta?

Sí, y es importante entender las diferencias entre los problemas de indexación y los problemas de rastreo.

Las etiquetas URL canónicas y meta robots envían una señal clara a los motores de búsqueda qué página deben mostrar en su índice, pero no les impide rastrear esas otras páginas.

Puede utilizar los robots.archivo txt y la relación de enlace nofollow para tratar problemas de rastreo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.