Para cualquiera que tenga una web, el aparecer en los buscadores para recibir visitas orgánicas es una preocupación que muchas veces raya incluso en la obsesión. Cualquier cosa que traiga más visitas a tu web es bien recibida, ¿verdad? ¡Claro que sí! Puedes debes saber que una de estas cosas es el sitemap.
Más aún, el sitemap es un requisito indispensable para que los motores de búsqueda indexen correctamente la totalidad de tu web. Pero, ¿qué es y como funciona un sitemap? Y, sobre todo, ¿qué tengo que hacer para que mi web tenga uno?
Tabla de contenidos
Qué es un sitemap
Empecemos por el principio, viendo qué es un sitemap y qué es lo que hace que sea tan importante para nuestra web.
En realidad un sitemap no es más que un archivo (aunque, de hecho, puede estar dividido en varios) en un formato especial, XML, que le indica a los motores de búsqueda cuáles son las páginas (y con páginas me refiero a URLs, tanto lo que en WordPress se entiendo por páginas, como entradas, productos, etcétera) que quiero que indexen y dónde están, junto con alguna información extra.
¿Qué información proporciona un sitemap?
Lo fundamental ya lo he dicho: el sitemap le dice a los buscadores qué direcciones de nuestro sitio web queremos que se indexen y dónde están, es decir, cuál es su URL. Pero no es ésa toda la información que le proporcionan a los motores de búsqueda.
Un sitemap proporciona además otras informaciones importantes, como cuándo fue la última vez que se modificó el contenido de cada una de esas páginas, cada cuánto tiempo recomendamos que el crawler vuelva a visitarla (esto no es más que una recomendación, luego el motor hará lo que crea más conveniente), o incluso cuántas imágenes hay en el contenido.
Estructura de un sitemap
Como decía más arriba, un sitemap no es más que un archivo en formato XML que contiene esa lista de páginas, aunque a veces la cosa se puede complicar un poco más. Si por ejemplo visitas el sitemap de esta web verás que no contiene una lista de páginas, sino una lista… ¡de otros sitemaps!
Y es que muchas veces el sitemap, para prever futuros contenidos kilométricos, se divide en otros sitemaps más manejables y específicos. En el caso del sitemap de esta web, verás que contiene enlaces a otros cinco sitemaps:
- Uno con el listado de páginas
- Otro con el listado de entradas
- Otro con los plugins para descarga que tengo
- Uno con las categorías del blog
- Y un último con las categorías de los plugins
Es decir, hay un sitemap distinto para cada tipo de contenido. Esto no es más que una forma de evitar que el sitemap acabe teniendo miles de URLs, quedando dividido en archivos más manejables.
El contenido del sitemap
Como ya he dicho antes, un sitemap no es más que un archivo llamado sitemap.xml que debe estar en la raíz del servidor. Es decir, debe ser accesible en la dirección:
http://www.tuwebsuperchula.com/sitemap.xml
También puedes hacer que esa dirección redirija a la que realmente contiene el archivo del sitemap, pero de una forma u otra al acceder a esa URL hay que «aterrizar» en el sitemap. O bien, si está en formato comprimido (que también se puede hacer), a través de:
http://www.tuwebsuperchula.com/sitemap.xml.gz
De todos modos, antes de que te pongas manos a la obra a construir tu sitemap para subirlo al servidor, te ahorraré trabajo: no tienes que hacerlo así, hay herramientas para automatizar el proceso. Pero, para quien le guste ensuciarse las manos, ahí van los contenidos obligatorios que debe tener un sitemap:
- Debe comenzar con la declaración del lenguaje XML
- El contenido debe estar entra las etiquetas <urlset> y </urlset>
- Cada dirección (URL) incluida en el sitemap debe estar entre etiquetas <loc> y </loc>
- Cada objeto loc debe estar entre etiquetas <url> y </url>
Así, el sitemap más básico para una web con una sola URL (la página principal) sería algo así:
http://www.miwebsuperchula.com/
Claro que eso se puede complicar mucho más. Como decía más arriba, un sitemap puede incluir más información. Lo más común es incluir la fecha de la última modificación (con <lastmod>), la frecuencia de actualización (con <changefreq>) y la prioridad que tiene respecto al resto de URLs de nuestro sitio (un valor entre 0 y 1, indicado con <priority>).
Un ejemplo algo más realista sería éste:
http://www.miwebsuperchula.com/
2016-10-10T18:02:00+00:00 always
1.00
Cómo crear un sitemap para tu web
Y tú dirás: Si, ya , ya. Toda esa teoría está muy bien, pero lo que a mí me interesa es saber qué tengo que hacer para que mi web tenga uno de esos. Tienes razón, supongo. Al fin y al cabo lo práctico es lo práctico. Por eso vamos a ello.
En una web creada en HTML/PHP, sin CMS
WordPress es el CMS más usado. A fecha de hoy, un 58,9% de las webs que usan algún CMS están hechas con WordPress. Sin embargo, «sólo» un 26,8% de las webs existentes usan este CMS. ¿Cómo se come eso?
Pues muy sencillo: el 54,5% de las webs (más de la mitad) están realizadas sin utilizar ningún CMS, código HTML/PHP puro y duro. Aunque la tendencia es que estas webs están desapareciendo, sustituyéndose en su gran mayoría por webs hechas en WordPress, que es el CMS que más crece.
Todas esas webs hechas sin CMS son supervivientes de otra época, cuando hacíamos las webs desde cero y «picando código». Eso ya pasó y, como digo, la tendencia es que las webs realizadas así disminuyen a una velocidad pasmosa. Pero aún quedan muchas.
¿Qué hacer entonces si tienes una de estas webs y necesitas un sitemap? No te asustes, no tendrás que crear un archivo XML desde cero con todos esos loc, y lastmod, y priority y todo lo demás. Como decía más arriba, hay herramientas automatizadas para ello. Aquí te dejo un par de ellas:
Todas ellas son herramientas online 100% gratuitas y funcionan de forma similar: pones la URL de tu web, la frecuencia (aproximada) de actualización, un par de datos más y ya está. La propia aplicación web te genera el sitemap en formato XML que puedes descargar.
La mala noticia es que tendrás que generar uno nuevo cada vez que añadas contenido, o bien ir añadiendo las nuevas URL al sitemap de forma manual. Sí, lo sé, una auténtica lata. Y cuando digo que lo sé, quiero decir que lo sé por experiencia propia.
Un sitemap para tu WordPress
Si utilizas algún CMS tienes las cosas más fáciles, porque todos (los que conozco) incluyen alguna herramienta para generar el sitemap de forma dinámica, bien en el core o bien en forma de plugin. WordPress no es una excepción.
WordPress, en su instalación por defecto, no genera el sitemap, pero alternativas no faltan gracias a los plugins.
Sitemap en WordPress con Yoast SEO
Empiezo por Yoast SEO porque es el plugin para SEO más utilizado (con razón, porque es el mejor) y mucha gente lo tiene ya instalado, por lo que utilizando su funcionalidad de generación de sitemap no necesitas ningún plugin extra.
La funcionalidad básica la puedes activar en SEO > Mapas del sitio XML, cambiando la opción Funcionalidad de mapa del sitio XML a Activado. Realmente no necesita casi configuración, pero no está de más que le des un repaso a las pestañas para afinar algunas cosas (en General no hace falta que toques nada).
Tipos de contenido
Aquí puedes elegir qué tipos de contenido se incluirá en el sitemap. Por defecto tendrás, al menos, tres tipos de contenido: Páginas (page), Entradas (post) y Multimedia (attachement), aunque algunos plugins pueden generar algunos otros. Si por ejemplo tienes WooCommerce también encontrarás ahí los productos como tipo de contenido.
Aquí se trata de hacer uso del sentido común, e incluir en el sitemap lo que queremos que Google indexe. Los archivos multimedia, por lo general, los excluiremos.
Entradas excluidas
En este apartado tenemos la oportunidad de decirle a Yoast qué contenidos concretos no queremos que se incluyan aunque le hayamos dicho que ese tipo de contenido sí debe incluirse. Por ejemplo, podemos querer que se incluyan en el sitemap las páginas, pero no la página de contacto, por ejemplo, si sólo tiene el formulario y está vacía de contenido.
Por lo general incluiremos en este listado cualquier página que, de ser indexada, pueda afectar a nuestro SEO por diversos motivos. Atento a:
- Las páginas sin contenido (como la del formulario de contacto)
- Las páginas llenas de enlaces salientes, como páginas con enlaces recomendados, listados de páginas amigas, páginas directorio y cosas así
- Las páginas con contenido no relacionado con nuestro nicho, como las páginas de contenido legal (la política de cookies, la política de privacidad…)
La forma correcta de añadir estas páginas es añadiendo los ID, separados por comas.
Taxonomías
De forma similar a los contenidos, podemos indicar aquí qué taxonomías queremos que se incluyan en el sitemap y cuáles no. Por defecto tendrás Categorías (category) y Etiquetas (post_tag) aunque, igual que antes, diversos plugins pueden añadir taxonomías, como las categorías de productos y etiquetas de productos en WooCommerce.
Google XML Sitemaps
Si no tienes un plugin de SEO que incluya la funcionalidad de generar sitemap, tendrás que instalar un plugin específico para ello. Y el mejor es Google XML Sitemaps.
Sólo tienes que instalarlo y acceder a los ajustes en Ajustes > XML-Sitemap. Los primeros apartados (Opciones Básicas y Prioridad del artículo) los puedes ignorar, ya que como vienen configurados por defecto están perfectos.
En cuanto al resto de apartados, repito lo dicho antes: se trata de aplicar el sentido común y de pensar qué queremos que indexe Google y qué no, teniendo especial cuidado con el contenido duplicado.
Desde ese momento no tendrás que hacer absolutamente nada, y Google XML Sitemaps generará tu sitemap de forma dinámica.
Vídeo: añadir y configurar un sitemap en WordPress
De todos modos te dejo un vídeo para que puedas ver ambas opciones y cómo configurarlas: tanto el caso de Yoast SEO como el de Google XML Sitemaps, con algunos consejos y mejores prácticas. Y, si te queda cualquier duda, ya sabes que tienes a tu disposición tanto el formulario de contacto como los comentarios.