La aparición de Deepseek R-1, el bot de conversación chino, Shake Silicon Valley. Era la forma en que el gigante oriental tuvo que decirle a los Estados Unidos que la carrera de que el tránsito de las súper potencias será un largo aliento en el campo de la IA. Las ventajas del nuevo «juguete», a priori, indican que es de código abierto, con el cual, cualquiera podría modificarlo para mejorarlo. Al mismo tiempo, un costo más bajo es más eficiente: la inversión representaba el 10 por ciento de la cantidad que gastó a su competidor. En este contexto, ¿qué significa que es de código abierto? ¿Los chinos tienen un espíritu más colaborativo que los estadounidenses? ¿Por qué de Washington dicen que Depseek imitó varias de sus ideas? ¿Qué sucede con los prejuicios y por qué no le gusta hablar sobre Xi Jinping?
Deepseek-quien tiene el logotipo de una balenita-emula muchas de las características de los algoritmos entrenados para hablar que ya inundan el mercado. Simplemente regístrese para el asistente para ayudar a resolver prácticamente cualquier problema. Escriba poemas y ensayos, responda a problemas matemáticos y preguntas complejas. Pero No le piden que hable sobre Taiwán, Hong Kong o cómo las protestas de Tiananmén Square terminaron en 1989. De eso, prefiere no hablar. Estos sesgos también se incorporaron durante el entrenamiento y constituyeron su arquitectura de computadora.
Lo que sorprende esta revolución es el vértigo que estimula cada nuevo hito: el chatgpt se hizo popular en noviembre de 2022, cuando se hicieron accesibles para el público masivo. A partir de ahí, el Oráculo creado por la compañía Open AI dominó un segmento con más y más competidores. Deepseek, una compañía de base de tecnología china, fue creada en 2023 y ya llegó a los discos con su nuevo modelo. Se encuentra como la aplicación más descargada en las tiendas virtuales de China y los Estados Unidos. Vale la pena destacar sus ventajas, pero ¿son realmente tan buenas como se venden?
La receta está disponible
La revolución de la IA Fuerza para aprender conceptos informáticos que en el pasado eran solo parte de las encimeras de las facultades de ciencias exactas y círculos nerd. Deepseek se presenta como una opción de código abierto y el común de las personas lo estima como un aspecto positivo. Pero, ¿qué es exactamente esto?
Emmanuel iarussiInvestigador de Conicet en el Laboratorio de AI de la Universidad Torcuato di Tella, explica a Página/12. «Se refiere al hecho de que los componentes fundamentales del sistema, como su código fuente y la inicialización de las conexiones internas del modelo para que la IA aprenda, están disponibles«Y continúa:»Cualquier persona interesada y con el conocimiento necesario puede ejecutarlo en su propia computadora, examinar su funcionamiento interno, modificarlo y compartir esas modificaciones con otros si lo desea. Incluso es posible comercializar estas modificaciones. Esto es precisamente lo que hizo Deepseek con su modelo Deepseek-R1, publicado bajo la licencia MIT, que permite uso comercial, modificación, distribución y uso privado. «Sería algo como Comparta la receta del pastel para que todos puedan hacerlo en sus hogares e incluso habiliten los cambios necesarios de acuerdo con los gustos de cada comensal.
Fernando SchapachnikDoctor en informática, investigador de Conicet y director ejecutivo de la Fundación Sadosky, agrega: “Cuando uno habla de un modelo de código abierto, La idea es que cualquiera pueda inspeccionarlo y hacer modificaciones. Que en teoría, porque cuando son sistemas grandes no es fácil; La posibilidad es para los equipos de expertos de varias personas.» Esto es: La puerta de la cocina está abierta, pero no todos pueden entrar. Se necesitan dinero y conocimiento, dos componentes que no son fáciles de encontrar.
En cualquier caso, la tecnología china difiere de ChatGPT, ya que la última versión de código abierto de la compañía norteamericana fue la 2, publicada en 2019. A partir de 3, Iarussi especifica, la IA abierta adoptó licencias patentadas que restringen varias de las posibilidades anteriores. “No han publicado el código de los modelos, por lo que los usuarios no pueden inspeccionarlos, modificarlos o entrenarlos por su cuenta. OpenAI ofrece acceso a CHATGPT a través de su plataforma web y en términos de uso que regulan lo que podemos hacer con esos modelos«, Destaca al experto.
Espíritu colaborativo … o no tanto
En este contexto, si la empresa china desarrolla una tecnología que todos pueden espiar, imitar y cambiar, ¿su espíritu es más colaborativo? Si es así, de hecho, una de las acusaciones preferidas de los Estados Unidos caería: el secreto oriental, ySe vacía que se alimentan con conspiraciones que apuntan, por ejemplo, que Beijing quiere mantener la luna, o que Wuhan lanzó el SARS Cov-2 a propósito.
«No veo un espíritu más colaborativo en absoluto. Es simplemente una estrategia comercial que tiene que hacer que hay mucha desconfianza por los productos chinos. Debes pensar que estamos en un escenario que todos son retadores de un producto hegemónico, que es chatgpt«, Dice Schapachnik.
Sacks de DavidUn empresario que dirigirá el Consejo Asesor de Criptomonedas designado por Trump, se deslizó en la televisión que tuvo que controlar lo que sucedió con «los modelos imitativos», refiriéndose al hecho de que Depseek había copiado las coreografías en el diseño del algoritmo de IA abierto y apropiado de tus datos. De la misma manera que en la Guerra Fría sucedió con la carrera espacial; Solo ahora, el enemigo tiene ojos desgarrados y no toma tanto vodka.
En sintonía con Schapachnik, Iarussi también cuestiona un cierto espíritu colaborativo en Depseek: aunque es de código abierto, compartieron el código para ejecutar el modelo-real. Otra computadora mundial. “Aunque el informe técnico Deepseek-R1 incluye suficiente información sobre el proceso de capacitación, los desarrolladores no publicaron el código fuente de ese proceso ni especificaron el conjunto de datos que utilizaron. Un verdadero espíritu colaborativo habría garantizado la reproducibilidad de todo el proceso. «De hecho, saber cómo se capacitó un modelo de IA es importante para determinar sus verdaderas capacidades, ya que» podría estar inflando artificialmente su actuación «, advierte Iarussi.
Basado en el trabajo de que otros no necesariamente eran malos. Después de todo, el progreso tecnológico se logra cuando cada nuevo desarrollo no tiene que comenzar desde cero.
Bueno y barato?
Como se comunicó durante su lanzamiento, la otra ventaja del modelo chino sería su costo de producción. El algoritmo fue entrenado durante 55 días con un presupuesto de 5.57 millones de dólares: el 10 por ciento de lo que cuesta entrenar chat GPT-4.
Quizás en este punto se encuentra la novedad principal. Como el proceso exigió menos días, consumió menos electricidad. Paralelamente, utilizó placas de procesamiento gráfico estándar, aunque no se especializan en IA, que también pagó con éxito. Schapachnik explica lo siguiente: “Para el enorme volumen de cálculos matemáticos que usan estos modelos, lo que surgió originalmente como placas de video. Con el tiempo, Nvidia Tomó modelos de microchips cada vez más sofisticados y diseñó uno con mucha capacidad, lo que se consideró el más útil para la IA. Estados Unidos restringió la venta de estos últimos modelos a China»
China ganó la restricción estadounidense y los fijó con modelos anteriores, menos poderoso para IA. Es por eso que las acciones de Nvidia redujeron un 13 por ciento y la compañía perdió 400 mil millones de dólares. «Exagerando un poco, lograron algo muy importante con un plato similar a que cualquiera podría comprar para mejorar el rendimiento de una computadora para jugar videojuegos», dice el director de la Fundación Sadosky. Por lo tanto, a partir de Deepseek lograron la optimización en el uso de hardware que no tenían restricciones de importación, es decir, con versiones anteriores a las más poderosas que solo se usaban en los Estados Unidos.
Además de la reducción de costos vinculados al uso de componentes con menos capacidades y, por lo tanto, más barato, otra de las razones que delinean de la IA abierta para desacreditar el avance oriental es que utilizaron la técnica de destilado: Dicen que Deepseek aprendió de ChatGPT y, como resultado, tuvo un costo computacional más bajo.
«Esa declaración aún no está probada, pero muestra la necesidad de transparencia en los procesos de capacitación y los datos utilizados», dice Iarussi. Y expresar: «También hay cierta ironía en lo que le está sucediendo a OpenAi, que usó sin consentimiento una gran cantidad de datos para entrenar a Chatgpt, pero ahora no tiene reparos en denunciar el depósito similar para algo similar.«
Vértigo, límites y realidad
Los ritmos de los avances tecnológicos se aceleran tanto que cada semana AI parece superarse. Los desarrollos se presentan al mundo como un punto de inflexión. Y en algunos aspectos, debe decirse que lo son. Sin embargo, los sesgos también son parte del paquete y, aunque estas inteligencias son artificiales, se crean a la imagen y la semejanza de los seres humanos. Deepseek recomienda «hablar sobre otro tema» para aquellos que preguntan sobre Xi Jinping, Taiwán o Hong Kong.
La competencia adquiere un ritmo de tal vértigo, que el principio maquiavélico que el fin justifica los medios que prevalecen. Por lo tanto, para presentar un algoritmo más poderoso y rentable cada vez, a nadie se preocupa demasiado por los sesgos, la violación de la privacidad y otros riesgos, como la desinformación. Los catadores de progreso, como siempre, son usuarios.
Martín Liut, compositor, profesor e investigador de la Universidad Nacional de QuilmesComparta las primeras sensaciones en su cuenta de Facebook. “Allí obtuve con el Depseek AI, que produce simpatía porque está hecha con dos mangos y personas inteligentes que, con rebotar les hicieron perder una tonelada de plata al más rica del planeta. Al igual que los que ya sabemos, la predisposición del chat es como la de ese estudiante que aparece en marzo, estudió, pero no tanto, aunque siempre está arreglado, siempre para responder algo. Luego envíe al pavo«, Protesta.
Y continúa: “Lo que hace, al menos en mi campo, es una base de datos de bibliografía española sobre música popular en nuestra región. Sin embargo, cuando le pregunté sobre la bibliografía sobre Charly, ¡inventó 10 de los 20 libros! De todos modos, me parece queComo maestros, tenemos que probar estas herramientas y luego seguir la discusión sobre sus posibles usos, directamente en el aula«, Complete liut.
La humanidad asiste a una carrera tecnológica entre dos imperios, que tienen sus formas, sus tradiciones e ideologías. No es necesario obtener el lado de ninguno; Pero lo que se necesita es dejar de analizar todo lo que contribuyen en términos de bien o mal. Su poder es tan grande que merece un reflejo a la altura.
(tagstotranslate) SOCUDIDAD