10 minutos

18 ago 2023

Trabajadores RLHF y la Nueva Economía Sombra

Trabajadores RLHF y la Nueva Economía Sombra

Una nueva economía de trabajos temporales impulsó el ascenso mercurial de ChatGPT y otros; aquí se explica cómo también puede beneficiar a los humanos.

Números Coleman

varios artículos que muestran la nueva economía en la sombra de la IA

Me ocurre que mi pensamiento sobre la seguridad de la IA ha sido, hasta hace muy poco, algo así como el miedo vacío que experimenta el narrador en "La madriguera" de Franz Kafka en relación con un ruido omnipresente, inexplicable y aterrador. Hay un sentido real y tangible de amenaza inminente que los instintos básicos no pueden negar, pero no puedo articular qué es, de dónde viene, o por qué debería estar aterradoramente asustado cuando mis pronosticadores tecnológicos favoritos profetizan de manera arcana sobre futuros de posescasez, un fin al trabajo aburrido, una nueva revolución científica, etc. etc. Hasta hace poco, he vacilado entre atribuir este miedo a la paranoia luddita y adoptar la mortal y seria morbilidad existencial que el periodista y autoproclamado escéptico de la IA Freddie DeBoer identifica como su propia forma de milenarismo oscuro.

Pero eso ha cambiado. He encontrado la fuente de mi peculiar ruido psíquico. Y no estoy cavando más lento.


La Tarea

Hace un par de meses escribí sobre la IA y el trabajo significativo, resumiendo esencialmente un artículo académico más largo que esboza varios resultados sobre cómo la IA podría afectar negativamente (principalmente) y positivamente (vagamente) nuestra experiencia del trabajo diario. En ese momento, encontré los hallazgos interesantes de la misma manera que los anuncios sobre comida rápida reluciente son apetitosos.

Luego leí este artículo de New York Magazine sobre trabajadores de RLHF en Kenia y, bueno, me dio una gran hambre. Si estás siguiendo mi metáfora.

La historia traza la rápida expansión de una clase baja basada en trabajos esporádicos. Trabajadores remotos en naciones en desarrollo son contratados para quedarse en casa y etiquetar datos: imágenes de ropa, clips de unos segundos de grabaciones de tráfico, correos electrónicos de spam, videos de TikTok, empaques de alimentos, y cualquier otra cosa bajo el sol que pueda ser alimentada en las voraces sesiones de entrenamiento de varias aplicaciones de aprendizaje automático.

Los anotadores están restringidos de describir su trabajo a nadie y se les da información mínima sobre para qué es realmente su trabajo. El trabajo de los trabajadores es transitorio e inconsistente, dependiendo de los grandes contratos de entrenamiento de corporaciones remotas, lo que significa que los trabajadores no pueden depender del trabajo para un salario estable. Y el empleo en sí no es precisamente un camino de rosas. En el caso de el trabajo de RLHF que habilitó ChatGPT, OpenAI contrató a una firma en Nairobi para contratar anotadores a 1.32-2.00 USD para etiquetar contenido explícito, incluyendo ofertas tan apetitosas como “abuso sexual infantil, bestialidad, asesinato, suicidio, tortura, autolesión e incesto”, según el escritor de Times Billy Perrigo. Los trabajadores que hablaron con el Times relatan sueños perturbadores que animan los grandes éxitos de los horrores de su jornada laboral. (La firma de trabajadores luego canceló este contrato con OpenAI.)


Las Máquinas

Esta industria de anotaciones emergente es una lección del lado de la oferta sobre los peores incentivos vinculados al progreso de la IA. Los logros más milagrosos e impresionantes de la generación de IA del último año están inextricablemente ligados a un preocupante ambiente laboral distópico: uno donde el trabajo intelectual humano está atomizado al estilo Ford en tareas repetitivas y descontextualizadas de cualquier sentido de producción significativa. Las capacidades que hacen a las personas distintas y valiosas en comparación con las máquinas—la habilidad para comprender el contexto, reconocer e integrar casos límite, lidiar con situaciones novedosas y difíciles—son requisadas y consumidas por una red impersonal de contratistas esporádicos. Por supuesto, este tipo de trabajo no es totalmente nuevo, y no es exclusivo de la IA; pero la explosión de productividad que promete la moderna IA generativa incentiva una rápida expansión de la industria.

Tan seductor como es culpar esto a la codicia corporativa desenfrenada, no considero que sea del todo productivo, y no del todo cierto; después de todo, los nuevos barones ladrones de la era del aprendizaje automático han sido visiblemente vocales sobre un compromiso con la alineación y seguridad de la IA. Anthropic comprometió un poder administrativo importante a una  junta de fideicomisarios preocupados por la seguridad que no pueden obtener ganancias de la empresa. Sam Altman ha estado vigoroso en sus llamados a la regulación de la IA y ha testificado ante el Senado de EE.UU. al respecto. En Google Deepmind, Demis Hassabis ha afirmado que las empresas deben “proceder con un cuidado excepcional”.

Si estos primeros gestos se materializan en compromisos profundos de seguridad es una pregunta para otro blog. Basta decir: creo que el desprecio honesto, más que la ignorancia voluntaria, explica la situación de los maltratados trabajadores en Kenia y en otros lugares. Mantengo esta afirmación en parte porque es más interesante que su animosidad rutinaria de comer ricos que ocupa Wall Street, pero sobre todo porque, si es cierto, nos abre a un camino hacia adelante más productivo: construir empresas y sistemas que sean activamente conscientes y preocupados por el bienestar humano integral.


Los Humanos

No seré el primer diseñador de sillón en invocar los principios del diseño centrado en las personas en una crítica de empresas tecnológicas multimillonarias, pero en las predicciones por turnos mesiánicas y diabólicas acerca del futuro de la IA, es una perspectiva que no a menudo escucho en el discurso popular. Probablemente hay mucho que decir al respecto. Por ahora, sin embargo, limitaré mis comentarios al caso particular de los trabajadores. La inestabilidad financiera inherente a esta nueva clase laboral, sus cualidades explotadoras, y su carga psicológica, pueden ser aliviadas si las empresas hacen un mejor trabajo de escuchar: de reorientarse en relación con los trabajadores de modo que ellos sean partes interesadas clave además de—y quizás por encima de—los grandes clientes hambrientos de datos como OpenAI.

El profesor de diseño y ex VP de Apple Don Norman llama a este enfoque ser “centrado en las personas”:

Muchos de los sistemas, procedimientos y dispositivos de hoy son centrados en la tecnología, diseñados alrededor de las capacidades de la tecnología con personas siendo pedidas para llenar las partes que la tecnología no puede hacer.

Esto, en cierto sentido, es donde estamos hoy con los trabajadores. La IA necesita enormes cantidades de datos de entrenamiento que no puede suministrar por sí misma—y aun cuando está entrenada, aparecen casos límite que los algoritmos no tienen la estructura mental para manejar. Los trabajadores pre-digestan esta novedad para los sistemas de IA etiquetando y categorizando en clases discernibles. Los humanos se convierten en apéndices del superorganismo de un sistema de aprendizaje profundo y su organización propietaria.

Ser centrado en las personas significa cambiar esto, comenzando con las necesidades y capacidades de las personas. Significa considerar a todas las personas que están involucradas, teniendo en cuenta la historia, cultura, creencias y entorno de la comunidad. La mejor manera de hacer esto es permitir que aquellos que viven en la comunidad proporcionen las respuestas.

¿Cómo podrían cambiar las vidas de los trabajadores si las empresas que los contratan se tomaran el tiempo para comprender mejor su experiencia diaria? Si estas empresas fueran reflexivas al promover y capacitar a hombres y mujeres de la comunidad—expertos en su “historia, cultura, creencias y entorno”, ¿podrían las empresas construir mejores procedimientos de capacitación? ¿Crear entornos laborales más propicios al bienestar psicológico y, por lo tanto, más productivos? ¿Ofrecer paquetes de compensación que se ajusten mejor a las necesidades de los trabajadores locales y atraigan a las mejores personas?

Quizás todo esto suene un poco trillado y obvio; pienso que es importante, no obstante. La industria de los trabajadores no va a desaparecer, especialmente a medida que los sistemas de IA se vuelvan más generalizados y omnipresentes. Para bien o para mal, cada vez más trabajo se centrará en introducir IA desincorporadas en las confusas incertidumbres de la vida incorporada. Esta búsqueda, como hemos visto con la aparición de ChatGPT a través de RLHF, promete enormes ganancias en investigación y negocios.

En el corazón de esa búsqueda está la incómoda pregunta: ¿vamos a ser centrados en la IA o en los humanos? ¿Serán nuestros lugares de trabajo santuarios reflexivos a la superinteligencia inhumana o centros vivificantes de asociación entre estos sistemas sorprendentes de mejora mental y cerebros humanos conscientes, versátiles y vívidos?

Sé el futuro que quiero.

Boletín sobre IA en el Aprendizaje

Mantente al día con las tecnologías de vanguardia que están cambiando la forma en que las personas aprenden e instruyen.

Boletín sobre IA en el Aprendizaje

Mantente al día con las tecnologías de vanguardia que están cambiando la forma en que las personas aprenden e instruyen.

Boletín sobre IA en el Aprendizaje

Mantente al día con las tecnologías de vanguardia que están cambiando la forma en que las personas aprenden e instruyen.

Otros Blogs

Otros Blogs

Otros Blogs

Todos los blogs