Cómo escalar el uso de grandes modelos de lenguaje en marketing
La IA generativa y los grandes modelos de lenguaje transformarán la industria del marketing tal como la conocemos.
"Para seguir siendo competitivo, debe comprender la tecnología y cómo afecta nuestros esfuerzos de marketing", dijo Christopher Penn, científico jefe de datos de TrustInsights.ai, en su discurso en la conferencia Aprendermarketing.
Aprenda cómo escalar la implementación de Modelos de Lenguaje Grandes (LLM), el valor de la ingeniería rápida y cómo los especialistas en marketing pueden prepararse para el futuro.
La premisa detrás de los grandes modelos de lenguaje
Desde sus inicios, ChatGPT ha sido un tema de moda en la mayoría de las industrias. No puede conectarse en línea sin ver la opinión de todos al respecto. Aún así, no mucha gente entiende la tecnología detrás de esto, dijo Penn.
ChatGPT es un chatbot de IA basado en los LLM GPT-3.5 y GPT-4 de OpenAI.
Los LLM se basan en una premisa formulada por el lingüista inglés John Rupert Firth en 1957: "Conoces una palabra por el significado que tiene".
Esto significa que el significado de una palabra se puede entender a partir de las palabras que suelen aparecer junto a ella. En pocas palabras, las palabras no solo se definen por su definición de diccionario, sino también por el contexto en el que se usan.
Esta premisa es clave para comprender el procesamiento del lenguaje natural.
Por ejemplo, mira las siguientes oraciones:
- "Prepararé el té".
- "Yo derramo el té".
El primero se refiere a una bebida caliente, mientras que el segundo es una jerga para chismes. “Té” tiene significados muy diferentes en estos casos.
El orden de las palabras también es importante.
- "Prepararé el té".
- "El té que preparo".
Las oraciones anteriores tienen diferentes énfasis temáticos aunque usan el mismo verbo "preparar".
Cómo funcionan los modelos de lenguaje grande
A continuación se muestra un diagrama de sistema de transformadores, el modelo arquitectónico en el que se construyen grandes modelos de lenguaje.
Dos características importantes están aquí incrusta Y codificación de posición.Fuente: Atención es todo lo que necesitasVaswani et al., 2017.
En pocas palabras, un transformador toma una entrada y la convierte en otra cosa (es decir, "transforma").
Los LLM se pueden usar para crear, pero son mejores para hacer otra cosa a partir de una cosa.
OpenAI y otras compañías de software comienzan recopilando una gran cantidad de datos, incluidos millones de documentos, trabajos académicos, artículos de noticias, reseñas de productos, comentarios en foros y más.
Considere la frecuencia con la que aparece la frase "Prepararé el té" en todos estos textos grabados.
Las revisiones de productos de Amazon y los comentarios de Reddit anteriores son algunos ejemplos.
Tenga en cuenta la "compañía" que proporciona esta frase, es decir, cualquier palabra que aparezca cerca de "Prepararé el té".
"Sabor", "olor", "café", "aroma" y más dan contexto a estos LLM.
Las máquinas no pueden leer. Entonces, para procesar todo este texto, úsalos incrustael primer paso en la arquitectura del transformador.
La incrustación permite que los modelos asignen un valor numérico a cada palabra, y ese valor numérico se repite en todo el corpus de texto.
La posición de las palabras también es importante para estos modelos.
En el ejemplo anterior, los valores numéricos siguen siendo los mismos pero están en un orden diferente. Esta es una codificación posicional.
En pocas palabras, los modelos de lenguaje grande funcionan así:
- Las máquinas aceptan datos de texto.
- Asigne valores numéricos a todas las palabras.
- Mira las frecuencias estadísticas y las distribuciones entre las diferentes palabras.
- Trate de averiguar cuál será la siguiente palabra en la secuencia.
Todo esto requiere una potencia informática, tiempo y recursos significativos.
¡Consigue Aprendermarketing! A diario. Gratis. En tu bandeja de entrada.
Ingeniería rápida: una habilidad imprescindible
Cuanto más contexto y orientación proporcionemos a los LLM, es más probable que brinden mejores resultados. Ese es el valor del rápido desarrollo.
Penn ve las indicaciones como barreras protectoras de lo que producirán las máquinas. Las máquinas toman las palabras en nuestra entrada y las toman en contexto a medida que desarrollan la salida.
Por ejemplo, si está escribiendo avisos de ChatGPT, encontrará que las instrucciones detalladas tienden a producir respuestas más satisfactorias.
En cierto modo, las indicaciones son como resúmenes creativos para los escritores. Si desea que su proyecto se realice correctamente, no le dé a su escritor una directiva de una sola línea.
En su lugar, envíe un resumen lo suficientemente grande que cubra todo lo que desea que escriba y cómo escribirlo.
Escalar el uso de LLM
Cuando piensa en chatbots de IA, puede pensar inmediatamente en una interfaz web donde los usuarios pueden escribir indicaciones y luego esperar a que la herramienta responda. Eso es a lo que todo el mundo está acostumbrado.
“Este no es de ninguna manera el resultado final de estas herramientas. Este es el patio de recreo. Aquí es donde la gente puede jugar con la herramienta”, dijo Penn. "Así no es como las empresas llevarán esto al mercado".
Piense en la escritura rápida como programación. Eres un desarrollador que escribe instrucciones para que una computadora haga algo.
Una vez que haya optimizado sus avisos para casos de uso específicos, estará listo para usarlos API y solicite a los desarrolladores reales que incluyan estas indicaciones en un código adicional para que pueda enviar y recibir datos mediante programación a escala.
De esta manera, los LLM escalarán y mejorarán los negocios.
Dado que estas herramientas se implementan en todas partes, es importante recordar que todo el mundo es un desarrollador.
Esta tecnología estará en Microsoft Office (Word, Excel y PowerPoint) y muchas otras herramientas y servicios que usamos todos los días.
"Debido a que la programación se realiza en lenguaje natural, no son necesariamente los programadores tradicionales los que presentan las mejores ideas", agregó Penn.
Debido a que los LLM se basan en el autor, los profesionales de marketing o relaciones públicas, en lugar de los programadores, pueden encontrar formas innovadoras de usar las herramientas.
Estamos empezando a ver el impacto de los grandes modelos de lenguaje en el marketing, especialmente en las búsquedas.
En febrero, Microsoft presentó el nuevo Bing impulsado por ChatGPT. Los usuarios pueden comunicarse con el motor de búsqueda y obtener respuestas directas a sus preguntas sin tener que hacer clic en los enlaces.
"Puede esperar que estas herramientas hagan que su búsqueda sin marca sea mucho más fácil porque responden preguntas de una manera que no requiere clics", dijo Penn.
"Como profesionales de SEO, hemos visto esto antes, con fragmentos destacados y resultados de búsqueda sin clic... pero va a empeorar para nosotros".
Recomienda ir a Bing Webmaster Tools o Google Search Console y observar el porcentaje de tráfico que obtiene su sitio de búsquedas informativas sin marca, ya que esta es el área de mayor riesgo para el SEO.
Deja una respuesta