Sitemap XML: ¿Qué es, para qué se utiliza y cómo usarlo de manera correcta?

crear sitemap xml wordpress

Todos los sitios web, blogs, tiendas online y foros cuentan con un sitemap y posiblemente no lo sabias. Es más mi blog de marketing tiene un sitemap el cual le permite a las arañas de google entender la estructura del mismo. Es por ello que en este articulo he detallado todo lo necesario para hacer un uso correcto de el.

En el desarrollo de este articulo veremos temas tales como; que es un sitemap xml, como usarlo, para que sirve, donde se encuentra y otros más. Así que si te interesa quédate hasta el final.

Empecemos…

¿Qué es un Sitemap (mapa del sitio) XML?

Un mapa del sitio XML es una lista estructurada de todas las páginas de un sitio web disponibles para ser rastreadas por los motores de búsqueda. El mapa del sitio XML no está destinado a ser visto por los usuarios, ya que está escrito en un formato legible por máquina. Se utiliza en forma de archivo XML que contiene datos marcados con etiquetas. XML significa «lenguaje de marcado extensible», un formato de archivo acordado para ser utilizado para mapas de sitios.

Los robots rastreadores de motores de búsqueda pueden encontrar sus páginas de dos maneras:

  • Visitando todos los enlaces que se encuentran en una página y repitiendo esto para cada página visitada.
  • Visitando las páginas enumeradas en el mapa del sitio.

Un mapa del sitio es complementario al rastreo normal de la web. Sin embargo, la primera opción no siempre funciona. Por ejemplo, los motores de búsqueda no podrán encontrar e indexar una página que no esté vinculada desde ninguna otra página. Este es un caso en el que un mapa del sitio viene al rescate.

sitemap google

¿Qué tipos de mapas de sitio XML conocemos?

Mapa del sitio URL : esto es a lo que la mayoría de la gente se refiere con/como «mapa del sitio XML». Enumera las URL de las páginas de su sitio web.

  • Índice del mapa del sitio: un «mapa del sitio de mapas del sitio». Enumera todos sus mapas de sitio si tiene más de uno. Por ejemplo, puede tener diferentes mapas de sitio para publicaciones y páginas (común con los sitios web de WordPress) o múltiples mapas de sitio si uno de ellos excede el límite de tamaño. También necesitará varios mapas de sitio si supera el tamaño del mapa de sitio o el límite de número de URL.
  • Mapa del sitio de medios : puede crear un mapa del sitio separado para sus imágenes y videos o puede incluirlos en su mapa del sitio de URL normal.
Te puede interesar:   White Hat, ¡En el lado de los buenos! - Como Posicionar con buenas Prácticas SEO

¿Necesito un mapa del sitio XML?

Lo mejor es que solo puede beneficiarse de tener un mapa del sitio. No hay riesgos en tener uno.

Google afirma que «en la mayoría de los casos, su sitio se beneficiará de tener un mapa del sitio y nunca será penalizado por tener uno».

Pero, ¿vale la pena el trabajo extra por implementar un mapa del sitio?

Un blog con cientos de páginas bien estructuradas con un buen enlace interno probablemente no verá ninguna diferencia en la cantidad de páginas indexadas , porque todas ellas probablemente fueron indexadas incluso antes de tener un mapa del sitio.

¿Qué sitios web definitivamente deberían usar un mapa del sitio?

Grandes sitios web

Si tiene un sitio web con miles de páginas (por ejemplo, una tienda en línea), es genial que los motores de búsqueda conozcan todas sus URL disponibles para rastrear. Para que el rastreo sea más eficiente (lo que es especialmente importante para los sitios web grandes), debe incluir los últimos metadatos actualizados en el mapa del sitio.

Sitios web con páginas mal enlazadas

Si sabe que su sitio web tiene enlaces internos deficientes y algunas de las páginas pueden ser «huérfanas» sin ningún enlace interno o externo, es excelente tener un mapa del sitio para informar a los motores de búsqueda sobre su existencia.

Nuevos sitios web sin backlinks

Si acaba de iniciar un blog y su dominio aún no se encuentra en el SERP , la forma más fácil de captar la atención de los rastreadores es enviar su sitio web y su mapa del sitio XML a Google Search Console y Bing Webmaster tools.

Hay más en el mapa del sitio que estar indexado por los motores de búsqueda.

Por ejemplo, un mapa del sitio puede acelerar todo el proceso de rastreo. ¿Cómo? Puede contener información adicional importante para cada URL.

¿Qué información puede llevar un mapa del sitio?

Los sitemaps pueden (pero no tienen por qué) contener información valiosa (metadatos) para los motores de búsqueda. Los metadatos de mapas de sitio más comunes son:

1. Fecha de la última actualización de la página (atributo lastmod)

Esta es una de las piezas de información más valiosas para los motores de búsqueda. En lugar de rastrear la página y verificar si algo ha cambiado (y, por lo tanto, gastar valiosos recursos y tiempo de CPU), puede simplemente verificar el último campo actualizado en el mapa del sitio y hacer los cálculos simples:

Te puede interesar:   Crear Logo Para Pagina Web Gratis y sin Registro

Crawler: la última vez que rastreé esta página fue el 1 de marzo de 2019. El mapa del sitio me dice que la página se actualizó por última vez el 14 de febrero de 2019. No tengo que perder el tiempo rastreando e indexando esta página sin cambios y prefiero gastar mi tiempo rastreando páginas que han cambiado desde mi última visita.

Es una situación de ganar-ganar. Tu página se rastreará antes y los motores de búsqueda ahorrarán recursos que, de otro modo, se gastarían en volver a rastrear y comparar sus páginas. Como resultado, los motores de búsqueda tienen un índice de sitios web más actualizado.

2. Con qué frecuencia se actualiza una página (atributo changefreq)

Este es complicado. Al principio, parece una información más para que los motores de búsqueda mejoren su optimización de rastreo. ¿Pero no es un poco redundante?

¡Sí, lo es! En realidad, la fecha de la última actualización es un indicador mucho mejor si es necesario volver a rastrear un sitio web. Es por eso que todos los principales motores de búsqueda ignoran este atributo.

3. Cuán importante es una página (atributo de prioridad)

Suena como una buena manera de informar a los motores de búsqueda de las páginas más importantes de mi sitio web, ¿no es así? Bueno, esto es lo que John Mueller de Google tiene que decir sobre esto:

Es posible que otros motores de búsqueda sigan utilizando el atributo de prioridad, pero no se conocen más detalles. Estos son los 3 usos más probables del atributo de prioridad:

Las páginas de alta prioridad pueden rastrearse con más frecuencia
Si dos páginas coinciden con la misma consulta, la página con una prioridad más alta podría ser la que se muestra en los resultados de búsqueda.

Si un sitio web es nuevo, las páginas de mayor prioridad pueden indexarse ​​primero
Una forma mucho mejor de calcular la prioridad de cada página de su sitio web es echar un vistazo a los enlaces internos. Es probable que las páginas con la mayoría de los enlaces internos (y los más destacados) sean las más importantes. Es por eso que Google ignora el atributo de prioridad por completo.

4. Presencia de una versión en idioma alternativo

Declarar alternativas de hreflang directamente en el código de cada página puede ser una molestia para los sitios web con miles de páginas. Afortunadamente, puede declarar todas las mutaciones de su idioma en un archivo de mapa de sitio XML. Para obtener más detalles, consulte la guía hreflang del mapa del sitio oficial de Google.

Requisitos del archivo de mapa del sitio XML

Un mapa del sitio puede ser una lista de URL de texto sin formato (no recomendado) o puede usar el protocolo del mapa del sitio y hacer uso de etiquetas XML (la mejor manera de hacerlo). Debe estar codificado en UTF-8 y se puede comprimir en formato gzip (muy recomendable).

El tamaño máximo de archivo es de 50 MB (comprimido o no) o 50.000 URL.

Te puede interesar:   Robots.txt: ¿Qué es y cómo funciona?

Si desea incluir más de 50,000 páginas en el mapa del sitio, solo tiene que dividirlo en dos o más archivos de mapa del sitio y crear un índice del mapa del sitio que se vinculará a todos esos sub-mapas del sitio.

Lo mismo se aplica al límite de tamaño de 50 MB. Si excede el límite máximo, deberá dividir su mapa del sitio en varios mapas del sitio vinculados desde el índice del mapa del sitio principal.

Si todo esto es demasiado técnico para usted y su sitio web se ejecuta en WordPress, use un complemento (como Yoast SEO ) que hará el trabajo por usted.

Preguntas frecuentes

¿Debo usar el atributo de prioridad en el mapa del sitio?

El atributo de prioridad está destinado a señalar la importancia de sus páginas: las páginas más importantes se pueden rastrear con más frecuencia. Sin embargo, hay una gran advertencia:

¡Google no tiene en cuenta este atributo en absoluto! Y con la cuota de mercado de Google de alrededor del 90%, no vale la pena el esfuerzo de incluirlos en su mapa del sitio en la mayoría de los casos.

Si usa un complemento que incluye automáticamente el atributo de prioridad en el mapa del sitio, está bien, pero no tendrá ningún efecto en su indexación o clasificación de Google.

¿Debe el mapa del sitio enumerar todas mis páginas?

No es necesario que el mapa del sitio incluya todas las URL de su sitio web, pero es posible que los rastreadores no encuentren las páginas sobrantes.

Está absolutamente bien omitir páginas que no le interesa indexar (es posible que se indexen de todos modos, use la directiva noindex para prohibir que los motores de búsqueda las indexen).

¿Puedo usar el mapa del sitio para informar a Google sobre las páginas que no quiero que se indexen?

Bueno, un mapa del sitio no te ayudará con eso. Un mapa del sitio es solo una ayuda para los rastreadores. Dejar una página fuera del mapa del sitio podría no tener ningún efecto.

Si no desea que se rastree su página , debe deshabilitarla en el archivo robots.txt . Sin embargo, es posible que la página aún esté indexada. Si no desea que su página sea indexada , use la metaetiqueta noindex .

¿Google encontrará mi mapa del sitio? ¿Dónde debo colocar el mapa del sitio?

La forma más popular es enviar el mapa del sitio directamente en Google Search Console . Lo mejor de hacerlo de esta manera es que verá si Google revisó su mapa del sitio, cuántas páginas encontró y cuántas de ellas están indexadas actualmente.

Si por alguna razón no desea que su sitio web esté en GSC, o para facilitar que todos los motores de búsqueda posibles del mundo encuentren su mapa del sitio, puede agregarlo a su archivo robots.txt (el primer archivo que visita un rastreador). cada sitio web).

¿Cómo hacerlo? Es muy fácil, solo agregue una línea como esta con un enlace a su archivo de mapa del sitio (o archivo de índice del mapa del sitio) a su archivo robots.txt:

Sitemap: https://www.domain.com/sitemap-name.xml

Cosas importantes a tener en cuenta

No hay nada que perder al tener un mapa del sitio, solo puede brindarle beneficios

Si tiene un sitio web pequeño con cientos de páginas estáticas, es probable que vea poco o ningún beneficio al tener un mapa del sitio.

Si tiene un sitio web con miles de páginas generadas automáticamente o que cambian constantemente (por ejemplo, una tienda en línea), un mapa del sitio puede ayudarlo a que sus páginas se indexen más rápido, y cada cambio se descubra e indexe más rápido también.

Es muy fácil configurar un mapa del sitio con CMS moderno a través de complementos (complemento Yoast para WordPress, etc.)

Tener un mapa del sitio no es un factor de clasificación de ninguna manera.

Un mapa del sitio no se puede usar para decirle a los motores de búsqueda que no indexen una página

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *