Qué miran los modelos de IA cuando evalúan a una organización

Qué miran los modelos de IA cuando evalúan a una organización: las cinco señales que determinan la representación

Un modelo de lenguaje no busca a tu organización. Infiere qué decir sobre ella a partir de patrones en sus datos de entrenamiento. Hay cinco tipos de señales que determinan esa inferencia: las fuentes que citan a la organización, quién avala su autoridad sectorial, si la narrativa es coherente entre fuentes, cuánto territorio ocupa en su sector y cuándo fue producido lo que hay disponible.

La pregunta que más me hacen los directores de comunicación cuando empezamos a trabajar en reputación algorítmica es: ¿por qué el modelo dice eso? La pregunta asume que hay una intención detrás de la respuesta. No la hay. Lo que hay es un mecanismo de inferencia, y ese mecanismo responde a señales concretas.

Entender esas señales es lo que hace posible actuar sobre ellas.

Por qué los modelos no «buscan» a tu organización

Los motores de búsqueda rastrean páginas web en tiempo real, indexan contenido y recuperan resultados cuando alguien hace una consulta. Los modelos de lenguaje no funcionan así. Su «conocimiento» está fijado en el momento del entrenamiento: el modelo aprende patrones a partir de un corpus que cierra en una fecha determinada, y a partir de esos patrones genera respuestas.

Cuando alguien le pregunta a un modelo de lenguaje qué hace una organización, el modelo no va a buscar la web de esa organización. Infiere la respuesta a partir de los patrones que absorbió durante el entrenamiento: qué textos mencionaban a esa organización, en qué contexto, con qué atributos, junto a qué otras entidades.

Ese mecanismo de inferencia tiene consecuencias directas para la reputación. Si los patrones que el modelo absorbió son escasos, fragmentados o incorrectos, la representación resultante también lo será. Y no hay forma de corregirlo directamente —no hay un formulario de edición, no hay un proceso de reclamación— porque la representación no es una página web: es el resultado de un proceso estadístico.

Lo que sí puede hacerse es actuar sobre las señales que alimentan ese proceso.

Primera señal: las fuentes que citan a la organización

El dato más básico que un modelo procesa sobre una organización es la cantidad y calidad de las fuentes externas que la mencionan. No se trata solo de número de menciones: se trata del tipo de fuente, su relevancia en el corpus y el contexto en que aparece la mención.

Una organización mencionada en publicaciones especializadas de su sector, en medios de referencia con amplia presencia en el corpus de entrenamiento y en documentos que otros textos citan a su vez, tiene más peso en la inferencia del modelo que una organización con mucha actividad propia pero poca presencia externa.

Esto explica uno de los patrones más frecuentes que observo en los diagnósticos: organizaciones con mucho contenido propio publicado —notas de prensa, blog corporativo, redes sociales— pero poca presencia en fuentes externas independientes. El modelo no pesa ambas cosas igual. Las fuentes externas tienen más influencia en la inferencia que el contenido propio.

Segunda señal: quién avala a la organización como referencia sectorial

Hay una diferencia entre que un modelo mencione a una organización y que la cite como referencia. En el segundo caso, el modelo la trata como fuente de autoridad —le atribuye declaraciones, la incluye como ejemplo en respuestas sobre su sector, la convierte en referencia para quienes hacen consultas sobre la categoría.

Ese estatus de referencia no viene del volumen de menciones. Viene de que otras fuentes con autoridad en el corpus la traten como tal. Si las publicaciones especializadas del sector citan a la organización como referencia, si otros textos relevantes la mencionan como ejemplo a seguir, si personas con presencia reconocida en el campo la recomiendan, el modelo procesa eso como señal de autoridad sectorial.

La implicación práctica: construir autoridad en modelos de lenguaje requiere presencia en conversaciones donde ya hay autoridad reconocida. El contenido propio no basta. Las relaciones con publicaciones y personas con presencia en el corpus de entrenamiento son parte de la estrategia.

Tercera señal: si la narrativa es coherente entre fuentes

Los modelos procesan múltiples textos sobre una misma organización y construyen una narrativa a partir de la coherencia entre ellos. Si las fuentes son consistentes —describen a la organización de manera similar, le atribuyen los mismos atributos, coinciden en lo que hace y cómo lo hace— el modelo genera una representación más precisa y más estable.

Si las fuentes son contradictorias o fragmentadas —algunas describen a la organización de una manera, otras de otra, sin un hilo narrativo común— el modelo puede mezclar atributos, confundir roles o generar una descripción genérica que no captura lo específico de la organización.

Este es el segundo patrón más frecuente en los diagnósticos: organizaciones cuya narrativa ha evolucionado con el tiempo, que han cambiado de posicionamiento, que operan en mercados muy distintos o que tienen descripciones públicas inconsistentes entre sí. El modelo no sabe cuál versión priorizar y genera una síntesis que satisface a nadie.

Cuarta señal: cuánto territorio ocupa la organización en su sector

La exposición sectorial —el espacio que ocupa la organización en las conversaciones de su industria— es una señal distinta de la autoridad. Una organización puede tener alta autoridad en un tema muy específico y baja exposición en el sector general. O al revés: mucha presencia en el sector pero sin autoridad particular en ningún tema.

Los modelos procesan esto como dos dimensiones separadas. La exposición determina si la organización aparece cuando se hacen consultas generales sobre el sector. La autoridad determina si aparece como referencia cuando se hacen consultas específicas sobre temas donde debería ser experta.

Para la mayoría de las organizaciones con las que trabajo, el problema más frecuente es el inverso al que esperarían: tienen más exposición sectorial de la que imaginaban pero menos autoridad temática de la que necesitan. El modelo las menciona en contextos amplios pero no las cita como referencia en los temas donde tienen posicionamiento real.

Quinta señal: cuándo fue producido lo que hay disponible

Los modelos de lenguaje tienen una fecha de corte de entrenamiento. Después de esa fecha, la información disponible deja de actualizarse en el modelo, aunque los datos anteriores a la fecha de corte permanecen. Esto crea un problema específico para organizaciones que han cambiado: si los cambios ocurrieron después de la fecha de corte del modelo, el modelo no los conoce.

Pero hay un elemento adicional que va más allá de la fecha de corte: la temporalidad de las fuentes que sí están en el corpus. Un modelo que procesa diez textos recientes y doscientos textos de hace cinco años sobre una organización va a ponderar los patrones históricos más que los recientes, simplemente porque hay más masa de datos históricos. La organización puede tener un posicionamiento nuevo pero una representación vieja.

Esto explica por qué el seguimiento en el tiempo es parte del trabajo de reputación algorítmica. El ACA-Score no es una medición puntual: es un índice que se repite cada 90 días para verificar si las señales han cambiado y si el modelo ha comenzado a incorporar la narrativa actualizada.

Cómo se combinan las cinco señales

Las cinco señales no actúan de forma independiente. En la práctica, el diagnóstico de la representación algorítmica de una organización implica evaluar cuál de las cinco está limitando más la calidad de la representación y en qué modelos el problema es más pronunciado.

La situación más común que encuentro: una organización con señales de fuentes externas débiles (primera señal), con coherencia narrativa limitada (tercera señal) y con mucho contenido propio que el modelo procesa como señal secundaria. El resultado es una representación vaga, genérica o desactualizada, aunque la organización haya publicado mucho.

Las cinco señales son, en definitiva, la razón por la que actuar sobre la reputación en modelos de lenguaje requiere una metodología específica. No son las mismas variables que gestiona una estrategia de SEO o de reputación online clásica. El diagnóstico que las mide es el primer paso para entender cuál es el problema real y qué tiene sentido hacer a continuación.

Autora: Sonia Yánez Blum, investigadora en reputación algorítmica y relaciones públicas. ORCID 0000-0002-6695-8129

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio