El sitemap es uno de los archivos principales en relación con la estructura de nuestro sitio web, ya que ayudan a los motores de búsqueda a comprender mejor la organización del sitio y, por lo tanto, a rastrearlo más fácilmente. Un aspecto clave cuando trabajamos posicionamiento SEO en nuestra página web. Así pues, vamos a descubrir cómo crear un sitemap XML, así como las diferentes preguntas y dudas que pueden surgir.
¿Qué es y para qué sirve crear un sitemap XML?
El sitemap son los archivos mediante los cuales proporcionamos información a los motores de búsqueda de la estructura del sitio web. Desde las páginas principales, los blogs o las categorías, hasta imágenes y vídeos, así como las relaciones que hay entre ellos.
Con estos archivos ayudamos a los robots a rastrear el sitio web de una forma más eficaz, ya que “les damos” de forma estructurada como está organizado el sitio web. De modo que sabrán qué páginas son más y menos relevantes, así como los cambios realizados recientemente, entre otros.
Será muy importante que crear un sitemap optimizado correctamente, ya que si no puede perjudicar a la visibilidad de las páginas en los resultados.
¿Cuándo es necesario crear un sitemap para un sitio web?
En general, si una página web contiene pocas páginas y están enlazadas adecuadamente entre ellas, los motores de búsqueda ya podrán rastrearlas. Aun así, crear un sitemap XML para una web pequeña, siempre y cuando esté correcto, es una acción que simplemente puede beneficiar a la visibilidad web.
Asimismo, en sitios web muy grandes, como comercios electrónicos o webs multilingües, será recomendable incluir sitemaps XML en el sitio web, con la finalidad de dar a los robots mayor facilidad de rastreo de las páginas y archivos.
El sitemap de una página web se encuentra en la raíz del dominio, igual que pasaba con el archivo robots.txt: www.miweb.com/sitemap.xml
Diferencia entre el sitemap XML y el mapa de sitio HTML
Encontramos diferentes formatos de sitemaps, como por ejemplo los sitemaps xml, el más utilizado, ya que está enfocado a facilitar el rastreo de los robots en el sitio web.
El sitemap XML está creado con el objetivo de facilitar a los robots de búsqueda el rastreo del sitio web, poniendo a su disposición los apartados con la estructura del sitio, así como las diferentes URLs.
En cambio, el mapa de sitio HTML está dirigido a facilitar la lectura de la estructura web a los usuarios, proporcionando un apartado con gran parte o todas las páginas principales de la web, entre otros.
¿Cómo crear un Sitemap XML?
Hay varias opciones para crear un sitemap XML para un sitio web. Y es que hay muchas herramientas online de terceros que te lo crean automáticamente, como por ejemplo XML Sitemap Generator o Screaming Frog.
Por otro lado, en los CMS más usados, como por ejemplo WordPress, también puedes crear sitemaps XML de forma automática mediante diferentes plugins SEO, como por ejemplo con Rank Math o Yoast SEO. Como vemos en el caso de Rank Math, automáticamente ya se configura tu página de sitemap.xml, clasificado por tipo de contenido (páginas, categorías, posts…).
Modificar este archivo lo puedes hacer desde Rank Math > Ajustes del Mapa de Sitio, y en este apartado podrás editar los diferentes mapas de tu sitio web en función del contenido.
Finalmente, también puedes consultar otras opciones para generar sitemaps para tu sitio web
Sitemaps estáticos o dinámicos
En función de la opción que escogemos, podremos crear sitemaps XML estáticos o dinámicos. Los sitemaps estáticos se editan manualmente y es más frecuente usarlos en páginas donde el contenido no varía periódicamente. Una opción no muy recomendable, en caso de que no podamos asegurar si actualización cada vez que creamos nuevo contenido. En cambio, los sitemaps dinámicos se actualizan automáticamente cada vez que creamos o eliminamos una página del sitio web, una mejor opción si tenemos una web con contenido que se actualiza con mucha frecuencia.
Informar a Google: enviar el sitemap a Google Search Console
Cuando tenemos un sitemap en la web, debemos informar a Google correctamente de ello. Mediante Google Search Console podremos enviar nuestro sitemap a Google para que lo utilice durante el proceso de rastreo del sitio web.
Para enviar el sitemap a Google, debemos iniciar sesión en Google Search Console > Sitemaps > Introducir la URL del sitemap del sitio web y enviarla. Y, a continuación, se incluirán todos nuestros sitemaps.
Incluir el Sitemap en el archivo Robots.txt
Incluir tu sitemap en el archivo de robots.txt es una buena práctica SEO, especialmente si no lo has enviado en Google Search Console, así como para otros rastreadores (bing…).
Consulta más información en ¿Cómo rastrea e interpreta Google el archivo robots.txt?
Sitemaps de otros tipos de contenido
Cómo hemos mencionado anteriormente, no solo puedes crear sitemaps XML de las páginas del sitio web, sino que también puede haber sitemaps de imágenes, vídeos o noticias, con la finalidad de indexado adecuadamente y facilitar el rastreo a Google.
Sitemaps de imágenes
Los sitemaps de imágenes tienen la función de facilitar el rastreo de Google de las imágenes del sitio web para que aparezcan en su galería de imágenes. Es recomendable usar esta opción en páginas webs donde la visibilidad de imágenes en resultados sea de interés para lograr tráfico de calidad.
Sitemaps de vídeos
En este caso, los sitemaps de vídeo sirven para ayudar a Google a descubrir e interpretar los archivos de vídeo del sitio web. Estos sitemaps son utilizados en webs donde el contenido audiovisual es de especial relevancia, como por ejemplo, si mostramos tutoriales o recetas, como mecanismo para conseguir conversiones en el sitio web.
Sitemaps de noticias
Finalmente, podemos crear sitemaps de noticias en el sitio web. Esta práctica es básicamente usada en periódicos y revistas de actualidad, ya que permite mostrar notícias en Google News.
Para saber más: preguntas y respuestas sobre cómo crear un sitemap xml optimizado
Asimismo, seguramente si creáis o ya tenéis una sitemap en vuestro sitio web, os entrarán u os han entrado varias dudas. ¿Qué pasa cuando eliminamos una URL de nuestra web en el sitemap? ¿Afecta si tengo una web en distintos idiomas? A continuación, vamos a dar respuesta a algunas de las preguntas más frecuentes.
¿Cómo indico en el sitemap que tengo una web con más de un idioma?
Si tenemos webs en diferentes idiomas, lo primero que debemos saber es que los plugins de WordPress, así como otros generadores online, crean sitemaps XML adaptados fácilmente. Por lo que no será algo que nos llevará mucho trabajo. Asimismo, siempre debemos comprobar que estén configurados correctamente.
De este modo, lo que debemos conocer es que hay dos métodos principales de implementar mapas de sitio multilingües, lo cual es recomendable definir y escoger en relación al tipo de estrategia internacional que hayamos escogido previamente en nuestro sitio web, ya sea por dominio genérico principal o por dominios de país.
Conoce más sobre cómo desarrollar una estrategia de SEO internacional
Así, si tenemos la web por subcarpetas en función de regiones o idiomas, incluiremos el sitemap en cada subcarpeta, por ejemplo: www.miweb.com/en/sitemap.xml o en www.miweb.com/es-es/sitemap.xml, como hemos explicado en casos anteriores.
En cambio, si tenemos un dominio genérico, incluiremos todos los sitemaps XML directamente ahí. www.miweb.com/sitemap.xml. En este caso, dentro del sitemap XML, indicaremos mediante la etiqueta hreflang, los diferentes idiomas de la web.
Por ejemplo, en caso de querer diferenciar los sitemaps de castellano e inglés:
¿Qué pasa cuando hago una redirección 301 o 302 en el sitemap?
Hacemos redirecciones 301 (redirecciones permanentes) cuando queremos pasar toda la autoridad de una URL a otra de forma permanente. En cambio, las redirecciones 302 se utilizan cuando son temporales. Así, pues… ¿Cómo afectan las redirecciones al sitemap? ¿Lo debemos actualizar o se hace automáticamente?
Para facilitar el rastreo e indexación web es recomendable que un mapa de sitio solo incluya páginas válidas. Por lo que si podemos evitar incluir URLs redireccionados será más comprensible para los motores.
En general, con los plugins instalados estos cambios URLs se actualizan automáticamente. Asimismo, no será necesario volver a enviar el sitemap en Google Search Console si los cambios que se han realizado son puntuales.
¿Las páginas 404 se incluyen en el sitemap?
Las páginas 404 no deben estar incluídas nunca en un sitemap XML. ¡No nos va a servir de nada! Y es como hemos comentado anteriormente, el mapa de sitio solo debe incluir URLs que queremos que los motores de búsqueda indexen. Por lo que tener páginas con errores 404 solo perjudica la visibilidad de nuestro sitio web, así como la experiencia del usuario.
En general, con los plugins instalados estos cambios URLs se actualizan automáticamente. Asimismo, no será necesario volver a enviar el sitemap en Google Search Console si los cambios que se han realizado son puntuales.
¿Con un sitemap XML se indexarán todas las URLs de mi web en Google?
Un sitemap XML es un archivo que ayudará a los robots a entender la estructura del sitio web por lo que facilitará el rastreo e indexación. Asimismo, eso no significa que todas las URLs que aparecen en el sitemap XML se indexen. Las páginas deben de tener contenido de calidad, estar enlazadas… Para que se indexen correctamente en los buscadores, y no solo incluidas en los sitemaps.
¿Qué pasa si tenemos Sitemaps XML con más de 50.000 URLs?
El límite máximo de URLs por sitemap es de 50.000URLs. Por lo que… ¿Qué haremos si tenemos más? Tal y cómo indicaba Google, la solución es generar más de un archivo sitemap por web. Los cuales puedes enviar individualmente mediante Google Search Console o crear un fichero índice de sitemaps, en el cual puedes incluir múltiples archivos de sitemaps. Entonces, será suficiente que en Google Search Console, solo envíes este índice.
¿Una URL canónica se debe incliuir en el Sitemaps XML?
Las etiquetas canonicals (rel=»canonical») definen la página principal de URLs con contenido duplicado o muy similar. Con estas etqiuetas indicaremos la versión principal y, a la vez, pondremos a «no index» las páginas con la etiqueta canonical. De aquí, a la respuesta a nuestra pregunta: ¿debemos incluir URLs canonicals en el sitemap XML) ¡No! Ya que, como hemos comentado, solo nos interesa incluir URLs rastreables para los motores de búsqueda.
Consulta más información sobre la etiqueta canonical en nuestro blog: ¿Cómo evitar contenido duplicado en un sitio web?
En resumen, en nuestro sitemap XML deberemos incluir aquel contenido interesante para ser rastreado, ya que nos interesa que sea visible para los usuarios, así como páginas indexables con un código 200. Páginas con contenido de calidad que nos pueden ayudar a conseguir tráfico orgánico.