El Bot de Google rastrea e indexa solo los primeros 15 MB de HTML ¿debería preocuparte?

Google ha actualizado su documentación de ayuda de Googlebot para especificar que el Bot de Google rastreará hasta los primeros 15 MB de la página y luego se detendrá:“

El Bot de Google puede rastrear los primeros 15 MB de un archivo HTML o un archivo de texto compatible. Todos los recursos a los que se hace referencia en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado. Después de los primeros 15 MB del archivo, el Bot de Google deja de rastrear y solo considera los primeros 15 MB del archivo para la indexación. El límite de tamaño de archivo se aplica a los datos sin comprimir. Otros rastreadores pueden tener límites diferentes”.

Este es un cambio que Google intentó anunciar: John Mueller ha confirmado recientemente que el Bot de Google ha estado indexando los primeros 15 MB durante bastante tiempo, solo que no estaba documentado oficialmente:

El tuit de John Mueller

Aunque hemos estado viviendo con esta «limitación» por quién sabe cuánto tiempo, y la web funciona bien, algunas personas de la comunidad SEO han expresado sus preocupaciones. Así que vamos a desacreditar un par de mitos.

¿Qué significa esto para el SEO?

Suena preocupante que hubiera contenido que no se utiliza para la indexación. Sin embargo, en la práctica, 15 MB es mucho HTML.

Según HTTP Archive , a partir del 1 de junio de 2022, la cantidad media de bytes HTML solicitados por una página en ordenadores de escritorio y dispositivos móviles es:

Bytes HTML de archivo HTTP por página

Entonces, si aún le preocupa que su sitio se vea afectado negativamente, no lo haga. Como dice Google :“Hay muy pocas páginas en Internet que sean más grandes en tamaño. Es poco probable que usted, querido lector, sea el propietario de uno, ya que el tamaño medio de un archivo HTML es unas 500 veces más pequeño: 30 kilobytes (kB)”.

De hecho, las mejores prácticas de SEO actualmente recomiendan mantener las páginas HTML en 100 KB o menos. Si ejecuta un sitio web de comercio electrónico también es aceptable tener una página HTML de 150-200 KB. 

En caso de que tenga una página web que incluya 15 MB de HTML, entonces su código debe estar estructurado de manera que coloque la información relevante para SEO en los primeros 15 MB del archivo HTML o basado en texto compatible. 

Pero para ser honesto, 15 MB de HTML es mucho, por lo que es posible que desee seguir las recomendaciones de Google :

«Si usted es el propietario de una página HTML que tiene más de 15 MB, tal vez al menos podría mover algunos scripts en línea y algún CSS a archivos externos, por favor».

Pero, ¿qué sucede si su contenido está enterrado bajo 15 MB de imágenes? El rastreo y la indexación se refieren solo al archivo HTML en sí. Pero la verdad es que si tu HTML es de 15 MB o más, tienes problemas más graves que el SEO de tu sitio.  

¿Qué significa un HTML de 15 MB para el rendimiento de su sitio?

Es muy posible que tu sitio web no se pueda utilizar, por lo tanto, sus visitantes tendrán una experiencia horrible o inexistente. 

Como regla general, si una herramienta de prueba tiene dificultades para obtener el HTML de su sitio, debería considerar aplicar algunos cambios.

Deja un comentario