SEO para LLMs: hacé que los modelos de lenguaje te encuentren y te citen

6 min

Hacer buen SEO hoy significa posicionarse bien en Google y también que los modelos de lenguaje como ChatGPT, Gemini o Claude puedan rastrear tu contenido, entenderlo y citarlo cuando un usuario hace una consulta relacionada con tu industria.

Lo que descubrí trabajando en esto es que los pilares de optimización no cambiaron tanto como parece. Contenido bien estructurado, base técnica sólida y autoridad construida con criterio siguen siendo el núcleo. Lo que sí es diferente es cómo funcionan los bots de los LLMs y qué aspectos ganan más peso en este nuevo contexto, y eso es exactamente lo que quiero desgranar acá.

Cómo rastrean el contenido los LLMs, y en qué se diferencian de Google

Los buscadores tradicionales como Google o Bing rastrean, indexan y clasifican páginas web según los criterios de sus algoritmos, devolviendo un ranking de resultados ordenados por relevancia.

Los LLMs funcionan distinto: construyen respuestas combinando fragmentos de distintas fuentes, sin generar rankings ni listas de links. Cuando alguien le hace una consulta a ChatGPT sobre un tema de actualidad, el modelo muchas veces sale a rastrear páginas web en tiempo real para encontrar la información más reciente y relevante, complementando su entrenamiento previo con datos actualizados. De ese rastreo toma pequeños pasajes, llamados chunks, que combina para formar la respuesta.

El objetivo, entonces, es que el bot encuentre tu contenido, lo entienda sin fricciones y lo considere suficientemente confiable como para citarlo.

Primer pilar: contenido estructurado para ser rastreable

El contenido que un LLM puede leer y fragmentar fácilmente tiene muchas más chances de ser citado que uno que presenta la misma información en bloques de texto densos y sin jerarquía. Estructurar bien el contenido es una condición técnica para que el bot pueda extraer chunks relevantes, además de una cuestión de legibilidad para el usuario.

Algunas prácticas concretas:

Usar encabezados con jerarquía clara (H1, H2, H3) que organicen el contenido en secciones identificables.
Evitar párrafos excesivamente largos sin cortes. Cada párrafo debería desarrollar una sola idea.
Usar listas numeradas o bullets cuando el contenido lo permite, especialmente para pasos, requisitos o comparaciones.
Responder preguntas específicas de forma directa, en lenguaje conversacional. Ese es el formato que los LLMs privilegian al construir sus respuestas.
Evitar el keyword stuffing. Los modelos de lenguaje procesan semántica, no densidad de palabras clave. El texto tiene que sonar natural.

Un bot de LLM no lee todo el sitio de una vez ni se queda con el title y la meta description. Va directamente al cuerpo del contenido, extrae el fragmento más relevante para la consulta que tiene que responder y sigue adelante. Cuanto más clara sea la estructura, más eficiente es ese proceso.

Segundo pilar: la base técnica que abre las puertas al bot

Los factores técnicos que facilitan el rastreo de los LLMs son prácticamente los mismos que se optimizan para el SEO tradicional. Una base técnica sólida sirve para ambos ecosistemas a la vez.

Robots.txt y acceso de bots

El archivo robots.txt controla qué bots pueden rastrear el sitio y qué secciones pueden ver. Para que los LLMs accedan al contenido, lo fundamental es no bloquearlos. Se puede agregar directivas específicas que autoricen a los bots de ChatGPT, Claude u otros modelos, pero si no se agregan esas directivas, los LLMs van a poder entrar de todas formas mientras no estén bloqueados explícitamente.

Existe un archivo en discusión llamado llms.txt, pensado específicamente para dar instrucciones a los bots de LLMs de forma similar a como robots.txt lo hace para los buscadores. Todavía no es un estándar oficial y no hay definiciones cerradas, pero vale la pena seguir su evolución.

Velocidad de carga y Core Web Vitals

Un sitio que carga lento interrumpe el rastreo del bot antes de que pueda recuperar el contenido. Tener los Core Web Vitals optimizados no solo mejora la experiencia del usuario y el posicionamiento en Google, también garantiza que el bot del LLM pueda completar el rastreo sin cortes.

Renderizado del lado del servidor

Si el contenido del sitio se renderiza con JavaScript del lado del cliente, el bot puede llegar a la página y encontrar el HTML vacío, sin acceso al texto real. Para que los LLMs puedan leer el contenido, el HTML tiene que estar disponible directamente desde el servidor, sin depender de que el cliente ejecute scripts para mostrarlo.

Sitemap XML, canonicals y códigos de respuesta

El sitemap XML le indica al bot cuáles son las URLs del sitio que vale la pena rastrear. Las etiquetas canonical le señalan cuál es la versión definitiva de cada contenido cuando hay URLs duplicadas o similares. Los códigos de respuesta correctos, especialmente los redirects bien configurados y los 404 bien identificados, evitan que el bot pierda tiempo en páginas que no existen o que apuntan al lugar equivocado.

URLs claras en contenidos con scroll infinito

Los sitios que usan scroll infinito presentan un problema específico para el rastreo. Sin URLs individuales para cada sección o página de contenido, el bot no puede navegar el contenido de forma ordenada, por lo que cada bloque relevante debería tener su propia URL accesible.

Schema Markup: protagonismo indirecto, pero relevante

Los datos estructurados, o schema markup, son etiquetas que le indican a los bots de los buscadores qué tipo de contenido hay en cada sección del sitio: un artículo, una pregunta frecuente, un producto, una reseña, una receta. Los LLMs los leen como texto plano, sin la capacidad de interpretarlos como datos estructurados del modo en que lo hace Google.

Sin embargo, tener el schema markup bien implementado sigue siendo relevante porque mejora el posicionamiento en los buscadores tradicionales. Y si un sitio está bien posicionado en Google o Bing, los LLMs lo van a considerar una fuente más confiable y van a ir a buscarlo. El impacto llega por esa vía indirecta, pero llega.

La recomendación es tener cada sección del sitio con su schema específico y correcto: FAQ para preguntas frecuentes, Article para artículos de blog, Product para fichas de producto, LocalBusiness para negocios locales. La lógica es la de una optimización técnica integral, donde cada mejora suma en todos los canales.

Tercer pilar: autoridad y menciones en el ecosistema digital

En el SEO tradicional, autoridad era prácticamente sinónimo de backlinks. En el contexto de los LLMs, la autoridad sigue incluyendo los enlaces entrantes, pero suma con más peso otros factores.

El framework EEAT (Experience, Expertise, Authoritativeness, Trustworthiness) que Google usa para evaluar la calidad de un sitio es también el criterio que los LLMs aplican al decidir si una fuente es confiable. Un contenido escrito por personas con experiencia real en el tema, con datos verificables, en un sitio técnicamente sólido y con presencia coherente en el ecosistema digital, tiene muchas más chances de ser citado.

Las menciones sin enlace, lo que en inglés se llama unlinked mentions, cobran más protagonismo en este paradigma. Que un medio relevante de tu industria mencione tu marca, aunque no incluya un hipervínculo, construye reputación que los LLMs procesan como señal de autoridad.

Podés profundizar en cómo trabajar la autoridad externa con foco en LLMs en nuestra nota sobre link building para inteligencia artificial.

Errores críticos que le cierran la puerta a los LLMs

Bloquear los bots de LLMs en el robots.txt, ya sea de forma explícita o como consecuencia de una directiva demasiado restrictiva.
Servir el contenido con renderizado del lado del cliente en JavaScript, lo que hace que el HTML llegue vacío al bot.
Publicar contenido sin estructura, en bloques de texto largos sin encabezados ni cortes, que el bot no puede fragmentar eficientemente.
Tener páginas rotas sin resolver. Los LLMs a veces citan fuentes que ya no existen, lo que perjudica la experiencia del usuario y la reputación del sitio.
Ignorar la velocidad de carga. Un sitio lento interrumpe el rastreo antes de que el contenido sea recuperado.

Hacia dónde va el ecosistema: Google y LLMs en paralelo

Google sigue siendo la principal fuente de tráfico orgánico y eso no va a cambiar de un día para otro. Pero los LLMs están ganando terreno como canal de descubrimiento, especialmente para consultas informativas y, cada vez más, para búsquedas transaccionales.

Un dato que empieza a aparecer en el análisis de e-commerce es que el tráfico que llega desde LLMs convierte a una tasa más alta que el tráfico orgánico tradicional. El volumen es todavía pequeño, pero la señal es relevante porque quien llega a un sitio desde la recomendación de un LLM, llega con una intención más definida.

El escenario que se está configurando es un ecosistema más amplio, donde conviven los buscadores tradicionales, los motores de respuesta basados en IA y los LLMs conversacionales. Optimizar para uno sin descuidar los otros es la manera más eficiente de capturar visibilidad en ese ecosistema completo.

Si querés revisar el estado técnico de tu sitio y ver qué oportunidades hay para mejorar tu visibilidad tanto en buscadores como en LLMs, podés ponerte en contacto con el equipo de Eleven.

Cómo podemos ayudar

Consultoría SEO

Aumenta tu visibilidad orgánica con nuestra asesoría personalizada, estratégica e integral.

¿Querés recibir más contenido como este?
Suscribite a nuestro newsletter

Únete a cientos de profesionales que ya están recibiendo las novedades más importantes de SEO cada mes. Suscríbete gratis y no te pierdas lo que está marcando la agenda en la industria.

Martin Noziglia

Consultor SEO que combina su formación en administración con más de 18 años de experiencia en SEO para crear estrategias que impactan en el crecimiento real de las marcas. Desde hace casi un década se especializa en crecimiento orgánico de apps, trabajando la visibilidad en stores como una extensión del SEO.