Los ilustradores están gritando “¡sangre!” ante la IA generativa, los escritores están en huelga contra los Modelos de Lenguaje Grandes, se están redactando, discutiendo e implementando leyes y regulaciones específicas sobre IA en todo el mundo. Mientras tanto, la IA está en todas partes, absolutamente en todas partes, personas en todo tipo de campos reportan aumentos de productividad, reducción de costos, los especialistas en marketing y spammers están viviendo el mejor momento de sus vidas, y la IA generativa se está acercando, a velocidades récord, a la lista de los modelos de negocio más rentables en la historia de la humanidad. Las redes sociales y la web se están inundando de contenido generado por IA, al punto de redefinir el valor del contenido mismo, y los políticos… Bueno, mejor ni vamos por ahí. Algo va a pasar, ¿ya estás estresado? Pensemos en esto:
Tomemos a los artistas como ejemplo, iremos en un viaje donde exploramos lo que realmente les está pasando ahora, luego intentamos entender un poco estos modelos de IA, qué hacen, y por qué el arte que fue “robado” ya no puede ser “desrobado”. Finalmente, usamos ese conocimiento para imaginar un posible nuevo modelo de negocio que pueda ser (al menos) un primer paso hacia un mundo más justo y amortiguar el caos.
Listening to the wind of change (The Scorpions)
Una encuesta global de más de 10,000 diseñadores freelance encontró que el 61% dice que la IA ya ha afectado sus ingresos, e interesantemente, más reportaron ganancias que pérdidas. Más de la mitad de esos diseñadores ahora usa activamente IA para optimizar flujos de trabajo o despertar creatividad y esperan aumentos de ingresos en 2025.
Mientras tanto, en el Reino Unido, una encuesta de casi 800 ilustradores reveló que el 26% ha perdido trabajo por la IA, y el 37% ha visto disminuir sus ingresos. Solo cerca del 12% de los ilustradores están usando herramientas de IA, lo que significa que la mayoría está en un riesgo muy real de perder sus medios de vida.
Lo que emerge es una división clara y creciente: los diseñadores comerciales y agencias están adoptando la IA como una herramienta poderosa para mejorar su arte y aumentar ingresos, mientras que muchos ilustradores tradicionales y otros artistas finos están luchando con trabajos perdidos o salarios decrecientes. Sin embargo, esto no se trata solo de adopción, debido al estado y capacidades de las herramientas actuales y especificidades del negocio, podría ser más fácil para algunos aprovechar sin ser “reemplazados” mientras que otros podrían tener que adaptar fuertemente su negocio y habilidades para sobrevivir.
También hay una barrera cultural/política ahí. Los artistas finos están respondiendo agresivamente a estos cambios, lo cual es una reacción comprensible. Aceptar la adopción podría debilitar sus casos legales y sus (muy necesarios) lobbies legislativos. Como efecto secundario, si eres un artista y tu reacción es tratar de entender la situación experimentando con ella y/o integrando IA en tu flujo de trabajo, incluso si es para criticarla artísticamente, muy rápidamente te sentirás amenazado por tu propia comunidad y etiquetado como traidor, ladrón o “no-artista”. Hay un miedo de que no hay vuelta atrás de compartir públicamente cualquier cosa que la IA haya tocado de alguna manera. Esto no nos ayuda a encontrar soluciones cooperativas.
Life, uh… finds a way. (Dr. Ian Malcolm, Jurassic Park)
Cuando llega una tecnología transformadora, como lo hizo internet en los 90s, comienza en caos. Nadie sabe cómo debe ser monetizada y comienzan a emerger grandes disrupciones. Pero una vez que se entiende un modelo rentable, se apodera y estabiliza el sistema. Con internet, ese modelo resultó ser la publicidad.
Los anuncios ahora generan más de 1 billón de dólares globalmente al año, con alrededor de 800 a 900 billones en gasto de publicidad digital, una suma que continúa aumentando del 7% al 9% cada año.
Mantengamos en mente que internet completamente disrumpió los principales canales de distribución de publicidad: periódicos, TV y radio.
Sin embargo, la publicidad digital prosperó porque capturó y monetizó lo que las plataformas online inherentemente recopilan: datos de comportamiento. Cada clic, scroll, o vista de video se convirtió en una acción monetizable, alimentando la masiva economía de la atención.
Same-same… but different… but still the same (James Franco / Cultura de memes)
Avanzando rápido al presente: la IA no llegó con las manos vacías. A diferencia del internet temprano, comenzó con usuarios ya pagando. Suscripciones, acceso API, contratos empresariales, flujos de ingresos emergieron desde el “día uno”, bajo el control de unas pocas compañías masivas que controlan completamente la tecnología y los recursos necesarios para operarla.
Solo en unos pocos años, el mercado de IA generativa se estima en cientos de billones, alcanzando rápidamente a la publicidad, con proyecciones llegando a $3–4 billones en la próxima década. Esos son números insanos.
Pero aquí está el giro: Mientras la monetización es clara y parece escalar muy rápidamente, los dos “combustibles” que mantienen estas máquinas funcionando se están agotando rápidamente. Estos “combustibles”, en mi opinión, son la clave de los modelos de negocio emergentes: poder GPU (microchips) y datos de entrenamiento (contenido).
He who controls the Spice, controls the Universe (Vladimir Harkonnen, Dune)
Entonces, sobre ese “combustible”, la parte de GPU es aburrida en este contexto, aunque Sam Altman predijo que reemplazaría al dinero por completo. Eso es para que gigantes como NVIDIA, OpenAI, AMD y Google peleen y tiren dinero… Pero los datos de entrenamiento, de eso es de lo que realmente quiero hablar: Hasta ahora, internet proporcionó a los entrenadores de modelos de IA con un pool infinito de contenido creado por humanos, todos los temas, todos los formatos, mayormente comentado y contextualizado, muchas situaciones grises de derechos de autor, mucha limpieza necesaria, pero todo “gratis” para usar (al menos en secreto). Fue un festín total.
Para los artistas, en realidad proporcionar su arte online, gratis, tanto como fuera posible era prácticamente la única manera de conseguir trabajo, al punto de que los clientes usaran la infame táctica de negociación “Exposición como moneda”.
Un poco de tangente sobre privacidad aquí: Si alguna vez piensas (todos lo hacemos… mayormente, no estoy juzgando): “¿¿Privacidad?? ¿Por qué debería molestarme? ¡¡No hago nada malo!! ¡Estoy orgulloso de lo que hago!” bueno… las cosas cambian, y cada vez que renuncias a tu privacidad, estás renunciando a algo de poder, así que mejor que recibas algo a cambio que valga la pena. Ten en cuenta, nunca sabes el precio futuro de lo que estás regalando. Pero bueno… aquí estoy escribiendo esto gratis… Los artistas han estado renunciando a su trabajo a cambio de publicidad para sus “servicios”, notoriedad, y comunidad. Y eso estaba bien, pero entonces llegó la IA, y se dio un festín con los datos, aprendió sus habilidades únicas y ahora puede hacer cosas increíbles que solo tú podías hacer antes. Y no quieren pagarte nada por ello. Sé que esto es enervante, parece injusto, no ético, y podría incluso ser ilegal en algunos casos… pero ese daño ha sido hecho más allá de reparación. Tu trabajo pasado, tu habilidad, ha sido “robada” y usada, puedes demandar e incluso obtener (quizás, en casos muy raros) una pequeña compensación, pero creo (y ese es todo el punto de este artículo), que proteger y monetizar tu trabajo futuro y tu lugar en la creación de estas tecnologías es donde está el valor ahora.
Ok, eso nos lleva de vuelta a nuestro punto anterior… datos de entrenamiento. Lo que parecía un buffet infinito se está convirtiendo rápidamente en un problema. Los investigadores de IA mayormente apoyan la “teoría de escalamiento” que básicamente dice, más datos, y el modelo más grande, mejor rendimiento tendrá. Se trata de tamaño y cantidad. Más es mejor. Eso junto con el potencial de las herramientas y la enorme inversión que se está haciendo, los modelos crecen rápido y consumen prácticamente todos los datos “fáciles de alcanzar” en internet. Sin embargo, creamos mucho, cada día se publican cerca de 720,000 horas de video (solo en YouTube) y se liberan cerca de 2 millones de artículos de noticias en internet. Pero ahora el valor de estos datos es conocido y la gente está luchando duro para legislar y bloquear a las compañías de usar estos datos para entrenar IA. La presión está puesta. Pronto los entrenadores de IA se quedarán sin datos de calidad para usar y el ritmo loco de avances podría desacelerarse.
Hay algunas estrategias de mitigación ya en movimiento para lidiar con esta escasez de datos, una es poner esfuerzo en desarrollar estrategias y técnicas para mejorar los modelos más allá de solo entrenar, y la otra es usar los modelos mismos para generar datos de entrenamiento sintéticos. Pero estos no están sin riesgos mayores y no escalarán lo suficientemente bien. La mejor apuesta para las compañías de IA, en mi opinión, es generar incentivos para que la gente creativa siga creando, más y más, y permitirles usar los datos para entrenar nuevos modelos. Esto significa darles a los creadores una parte justa del pastel. Si hay un ambiente cooperativo, las compañías de IA obtendrán datos de ultra-alta calidad, en un formato controlado, anotado y contextualizado bajo su propio control, lo cual es el sueño absoluto para los investigadores.
No es un problema simple, pero necesitamos empezar en algún lugar, y aquí es donde me gustaría contribuir con pensamiento.
Entonces, ¿qué hacemos ahora?
The same thing as every night, Pinky, take over the world! (Pinky and the Brain)
Entonces ahora sabemos dónde está el valor y sabemos que, para sacar lo mejor de la IA, deberíamos encontrar una manera de trabajar juntos. Eso hace que sea el momento de empezar a pensar en modelos de negocio que alineen todos los incentivos. He buscado y buscado, preguntado a todos los modelos de IA, pero no pude encontrar uno que me hiciera feliz, así que fui a mi cápsula de pensamiento (aka. la ducha) y me puse a trabajar… Esto es lo que se me ocurrió:
¿Qué tal si aumentamos los modelos de IA generativa con un nuevo tipo de red social que sirva el propósito de proporcionar datos para entrenar los modelos mientras aún sirve el propósito popular de las redes sociales: permitir que la gente se entretenga, se comunique y comparta información (y, desafortunadamente, el control político de masas más nefario que vemos estos días)? Entra la Red Generativa. Es básicamente casar ChatGPT con Instagram en sagrado matrimonio.
Desacoplaríamos los incentivos actuales de las redes sociales de servir a anunciantes capturando atención y esparciendo mensajes de marketing y reemplazaríamos esos con generar los datos más creativos, útiles o variados impulsados por humanos para que los sistemas de IA se alimenten. El dinero fluiría del uso del modelo de IA (con suscripciones, contratos empresariales, pago por generación, etc…) y parte del pastel sería alimentado de vuelta a los creadores en la red por proporcionar input creativo continuo en forma de datos de entrenamiento de alta calidad, apropiadamente licenciados, multi-modales, para que los modelos sigan mejorando.
Esto se vería como una red social normal pero menos restringida en términos de formato y algoritmo. La gente publicaría imágenes, pinturas, música, palabra hablada, poemas, libros completos, historias, videos, películas, documentales… y entonces serían pagados en micro-transacciones (justo como cuentas monetizadas en youtube por ejemplo) pero en lugar de por la cantidad de vistas o engagement, por relevancia a lo que se está generando en el lado del modelo de IA. Todas las cuentas en buen estado serían monetizadas y serían pagadas cuando alguien genere algo que podría haber sido “inspirado” en su trabajo.
El problema es, contra-intuitivamente, que cuando un modelo genera algo, nadie puede decir de dónde viene la “inspiración” en los datos de entrenamiento.
There is no spoon (The Matrix)
Los datos de entrenamiento (tu arte, sean imágenes, texto, audio, o lo que sea) no están almacenados dentro del modelo de IA. ChatGPT, por ejemplo, no mantiene una base de datos masiva detrás de escena de la cual copia y pega contenido. En lugar de eso, genera outputs completamente nuevos y originales basados puramente en operaciones matemáticas optimizadas para producir resultados que nos hagan sentido, algo así como nuestros cerebros.
Los datos de entrenamiento son un consumible, se usan en la fase de entrenamiento, antes de que el modelo sea liberado, y entonces efectivamente “descartados.” Una vez que el modelo está entrenado, ya no necesita directamente o usa tus datos originales.
Vamos rápidamente a través de esto porque hay un término que necesito que entiendas:
Inicialmente, el modelo de IA simplemente produce ruido aleatorio, sin importar lo que le preguntes. No puede producir nada significativo. Entonces, durante la fase de entrenamiento, el modelo ve muchos ejemplos de inputs (prompts, imágenes, texto, etc.) y sus correspondientes “outputs apropiados” (respuestas al input, aka.: tu arte) Aquí es donde algo llamado embeddings (¡recuerda esta palabra!) entra en juego.
Piensa en embeddings como una manera de convertir los datos de input (palabras, píxeles, sonidos) en listas de números, para que la IA pueda “digerir” y procesarlos matemáticamente. Estos embeddings agrupan conceptos similares cerca en espacio matemático (piensa en un gráfico pero en lugar de 2 dimensiones, tiene miles), ayudando al modelo a reconocer patrones y relaciones entre ideas, imágenes, sonidos y palabras. Para ponerlo simple, cosas conceptualmente relacionadas se pegan numéricamente. “Gato” estará cerca de “Peludo”, “Gatito” o “Animal” en la mayoría de dimensiones, y un poco más lejos de “Árbol” o “Computadora”. Aunque en algunas otras dimensiones, “Gato” podría estar relativamente cerca de “Computadora” debido a la obsesión loca que internet tiene con los gatos.
El modelo entonces lentamente ajusta sus operaciones matemáticas internas para transformar cualquier input en algo tan cerca como sea posible del output apropiado. Hace esto billones o incluso trillones de veces con muchos inputs/outputs diferentes hasta que se vuelve notablemente bueno prediciendo la “respuesta correcta.” Una vez que el entrenamiento está completo, esas operaciones matemáticas están “congeladas,” y el modelo está listo para uso.
En la fase de inferencia, cuando realmente usas el modelo para generar cosas nuevas, le proporcionas un nuevo input que nunca ha visto antes. El modelo convierte este input en embeddings, ejecuta sus operaciones matemáticas aprendidas en ellos, y genera un output enteramente original basado en predicciones de lo que sería una respuesta apropiada.
Los modelos son mucho más complejos por debajo, pero aquí está el punto esencial: tus datos no están almacenados o remezclados por el modelo. En lugar de eso, la IA aprende por ejemplo a predecir cómo tú o cualquier otro artista podría responder a una solicitud similar. Debido a la complejidad de estas operaciones matemáticas y cómo los valores están ajustados sobre millones de ejemplos, nadie puede identificar precisamente la fuente exacta de inspiración detrás de cualquier output específico, especialmente porque cada pieza de datos en el set de entrenamiento cambia los valores (pesos) establecidos por los otros, influenciando todo el sistema. Esto significa que el modelo necesita todos los datos para generar cualquier cosa, justo como un artista necesita todo lo que alguna vez vio, experimentó o aprendió para hacer una pintura.
I’m Winston Wolf. I solve problems (Pulp Fiction)
Aunque no podemos saber exactamente qué parte de los datos de entrenamiento contribuyó a una generación, eso podría no importar realmente, solo necesitamos encontrar una manera de dar a los creadores su parte del pastel e incentivarlos a continuar creando. Bajo esa premisa, definitivamente podríamos arreglárnoslas usando la parte de embedding del modelo de una manera inteligente.
¿Qué tal si alimentamos lo que sea que se genere de vuelta a la parte de embedding del modelo, convirtiéndolo en las coordenadas al mapa multi-dimensional en la mente del modelo y encontramos las piezas de contenido en la Red Generativa que están más cerca, y entonces pagamos a esos creadores un poco de dinero? No sería exacto pero sería una manera genial (y justa) de decidir a quién pagar, y cuánto, por los datos de entrenamiento proporcionados. Sería un sistema de “crédito” automatizado que sería difícil de manipular ya que está congelado como parte del modelo. Y también funcionaría igual de bien para “pre-pagar” por datos que aún no se usan para entrenamiento. Imagina que le pides al modelo un unicornio volando sobre un campo en el estilo de Van Gogh, esto probablemente “acreditaría” pinturas similares a Van Gogh pero también cualquier cosa con unicornios o campos, incluyendo textos que describen cómo se ve un unicornio o un campo o incluso cualquier cosa con pájaros (porque también vuelan y tienen alas).
En este mundo, paralelo a las redes sociales, “el algoritmo” sería el modelo de embedding y la función de éxito se movería de “lo que la gente quiere ver” a “Lo que la gente quiere/necesita generar”. Para las compañías de IA, sería una manera de diferenciarse de otros, ahora mismo, los modelos son muy diferentes pero los datos de entrenamiento son mayormente los mismos, al ejecutar y apoyar la red generativa, las compañías de IA se mantendrían en control de sus propios datos de entrenamiento y por lo tanto su “foso”. Esto también haría muy atractivo invertir en hacer la red generativa un éxito para sus usuarios/creadores. Para los artistas, esto podría significar ser pagados para verdaderamente desarrollar tu arte en tu propio estilo en cualquier dirección que quieras que vaya. Es creación por el bien de la creación. Y hay mucho potencial para canales de ingresos extra (lee los extras si estás interesado)
Espero que todo esto haya tenido sentido, es una idea nueva, aún restringida a mi cerebro y un puñado de otros, me encantaría discutirla con quien quiera, así que contáctame en LinkedIn, X, BlueSky o Instagram..
¡Saludos, y buena suerte!
Extras
Si encontraste esta idea interesante, hay mucho más que no cabría en la capacidad de atención o probable interés de la mayoría de lectores. Pero si eres uno de esos que quiere profundizar, entonces aquí vamos, vamos a geekear:
Let the games begin (Antiguos griegos en las Olimpiadas)
La parte interesante de construir el modelo de negocio así es que tiene tanto espacio para mecánicas y dinámicas (lenguaje de la industria de juegos). Tantas cosas con las que jugar para balancear todos los incentivos y crear algo verdaderamente mejor que cualquier red social existente:
- El precio sería clave por supuesto, solo balanceando la cantidad pagada por generación dependiendo del ingreso generado. También funciona al revés, el modelo de IA podría cobrar a los usuarios dinámicamente más (o menos) por pedir cosas que caen dentro de un “espacio crowdeado”.
- Ajustar el radio del pago dependiendo de qué tan crowdeado esté el espacio. Esto incentivaría a la gente a crear trabajo verdaderamente original “yendo” a áreas que no están muy crowdeadas.
- Estilos, prompts y arte original podrían ser destacados y publicitados a través de la red social. Creando un ambiente de retroalimentación controlable para alentar casos de uso populares donde el modelo actualmente falla.
- Etiquetado de datos y enriquecimiento de contexto usando likes, vistas, y métricas de engagement.
- Artistas incentivados a tener mucho arte en su propio estilo para que una generación toque la mayoría de sus trabajos a la vez. Acumulando más valor rápidamente.
- Versiones fine-tuned, especializadas de los modelos para contribuyentes/artistas específicos pagan más a la fuente.
- “Contratar” al artista más cercano para ajustar/curar/regenerar/sobrepintar/hacer brainstorming en una pieza generada.
- Embedding también podría ayudar a detectar, y marcar copy-catting (En cualquier caso, al menos el original también sería recompensado) Esto también es un incentivo para que los artistas entren al sistema y sean “registrados” como los creadores originales de algo.
- Des-monetizar áreas del mapa de embedding que son peligrosas o no éticas como desinformación política.
Podría solo seguir y seguir… pero es tarde. Durmamos en ello.