¿Por qué Google no indexa mi contenido correctamente?

Este post es una traducción del material ``Why doesn’t Google index my content properly?``, publicado originalmente en el blog de Yoast. Traducción y publicación autorizadas.

Antes de que Google pueda clasificar tu contenido, primero debe descubrirlo, tener permiso y la capacidad para evaluarlo e indexarlo. Si alguno de estos procesos falla, tus páginas podrían no aparecer en los resultados de búsqueda.

La mayoría de las veces, puedes confiar en que Google indexará tu contenido correctamente, de forma automática. Después de todo, este proceso es una de las partes fundamentales de lo que Google es y hace. Aunque, simplemente colocar tu contenido en línea no siempre es suficiente.

Si tienes problemas técnicos, contenido de baja calidad o controles de indexación incorrectos, podrías enfrentarte a problemas durante estos procesos de descubrimiento, evaluación e indexación.

Descubrimiento

Para indexar una página, Google necesita encontrarla. Esto significa que debe estar vinculada en algún lugar, ya sea desde otras páginas indexadas en el mismo sitio o desde otros sitios.

Dependiendo de la relevancia y calidad de los lugares desde donde está vinculada, puede llevar algún tiempo para que Google programe el seguimiento de estos enlaces y encuentre tus páginas. Esto también significa que la página no puede estar “oculta”, lo que, por ejemplo, podría significar contenido protegido por contraseña, bloqueado a través de robots.txt o disponible solo para usuarios de ciertos países.

Evaluación

Cuando Google descubre la página, analiza el contenido (incluyendo el código HTML y los recursos relacionados) para evaluar su calidad y relevancia.

Durante este proceso, existen varias razones por las cuales Google puede optar por no indexar una página. Estas incluyen:

  • Cuando Google determina que el contenido de la página es de “baja calidad”. Por ejemplo, si hay un conteo de palabras muy bajo, o si el contenido es una duplicación cercana/directa de otra página. Páginas particularmente “sobreoptimizadas” o “spam” también pueden ser ignoradas.
  • Cuando descubre instrucciones específicas de indexación en la página (como una meta etiqueta de robots o una etiqueta de URL canónica que apunta a otra página). Google hará una evaluación en estos casos para decidir si debe o no seguir las instrucciones, pero es probable que elija no incluir la página.
  • Cuando no puede ver/acceder al contenido. Para sitios que dependen mucho de JavaScript o que incluyen contenido de maneras complejas o no estándar, Google puede no ser capaz de consumir el contenido de la página. Puede ser que, para ellos, sea una página vacía (o de baja calidad).
  • Cuando hay un procesamiento pesado de JavaScript, Google puede programar un “rastreo de seguimiento” para analizar más profundamente antes de decidir si debe o no indexar. El tiempo que esto toma puede variar considerablemente, según los recursos de Google y la priorización de tus páginas.

Indexación

Si has superado todas estas pruebas, entonces tu contenido debería ser indexado con éxito y debería aparecer cuando lo busques.

CONSEJO: Intenta hacer una búsqueda de “site” en Google (por ejemplo, site:https://www.ejemplo.com/ejemplo-pagina/) para ver si una URL específica ha sido incluida en el índice.

Recuerda que, una vez que una página está en el índice, ¡esto no significa que permanecerá allí para siempre! Google rastrea y reevalúa el contenido repetidamente. Por lo tanto, si la calidad de tu contenido disminuye o si accidentalmente impides que Google evalúe el contenido, tu página podría ser removida del índice.

Equipo COMPC