Escriba para buscar

IBM y los grandes desafíos de la IA y la computación cuántica Innovación

IBM y los grandes desafíos de la IA y la computación cuántica

Alejandro Curioni

Alejandro Curioni

Alejandro Curioni

La IA está firmemente de vuelta en las noticias

El ChatGPT de OpenAI y los sistemas de generación de imágenes de IA como MidJourney y Stable Diffusion han conseguido que muchas más personas se interesen en la IA avanzada y hablen al respecto. Lo que es algo bueno. No será agradable si los cambios transformadores que sucederán en las próximas dos o tres décadas nos tomarán a la mayoría por sorpresa.

Una empresa que ha sido pionera en IA avanzada durante más tiempo que la mayoría es IBM. Uno de los ejecutivos más importantes de IBM, Alessandro Curioni, se unió al London Futurists Podcast para analizar los proyectos actuales de IBM en inteligencia artificial, computación cuántica y áreas relacionadas. Alessandro ha estado en IBM durante 25 años. Es miembro de IBM, director de IBM Research y vicepresidente para Europa y África.

Los grandes desafíos de IBM

IBM ha estado inventando el futuro de la informática durante 70 años. Ha protagonizado una serie de grandes desafíos impresionantes, como Deep Blue venciendo a Gary Kasparov en el ajedrez en 1996, y Watson venciendo a Ken Jennings en el concurso televisivo Jeopardy en 2011. Más recientemente, en 2018, la compañía desarrolló una máquina capaz de valerse por sí misma. en debates con un campeón mundial de debate.

Las primeras de estas máquinas estaban basadas en reglas, y las últimas usan aprendizaje profundo, que crean modelos entrenados en grandes cantidades de datos. Ahora se está produciendo otro cambio de paradigma, con la llegada de los modelos de lenguaje extenso (LLM), o modelos básicos, que utilizan una técnica llamada autosupervisión para realizar la capacitación. El sistema tomará una gran cantidad de oraciones, cientos de miles de millones de ellas, de la web, enmascarará aleatoriamente una palabra de cada oración e intentará adivinar cuál es la palabra. Con el tiempo, el sistema construye un modelo de qué palabras van en qué oraciones. Esta automatización del proceso de capacitación es un avance significativo y ha sido posible gracias a las enormes cantidades de datos y potencia de cómputo que están disponibles en la actualidad.

Resulta que esta metodología no está restringida al texto. Se puede usar en cualquier tipo de datos estructurados, incluidas imágenes, videos o códigos de computadora. O flujos de datos generados por procesos industriales. O el lenguaje de la ciencia: moléculas traducidas a símbolos.

Enfoque más estrecho

IBM está construyendo grandes modelos de lenguaje, pero para aplicaciones particulares en lugar de un uso general, como ChatGPT. Por ejemplo, está construyendo sistemas para especializarse en química orgánica y en negocios. La debilidad de los sistemas de propósito general es que son superficiales. Pueden responder la mayoría de las preguntas en un nivel alto, pero si profundizas, se pierden. Las máquinas más especializadas pueden profundizar más y son menos frágiles. Ser especializado a menudo significa que puede obtener datos de mejor calidad y puede eliminar el sesgo más fácilmente.

Una de las razones por las que ChatGPT funciona mejor que GPT-3 es el aprendizaje por refuerzo con retroalimentación humana (RLHF). OpenAI, que creó estos sistemas, contrató a un gran número de personas para comentar sobre el resultado del sistema y, en consecuencia, etiquetar pasajes sesgados u ofensivos. Esto provoca la broma de que AI no significa inteligencia artificial, sino indios asequibles, pero los humanos se utilizan durante el entrenamiento, no en funcionamiento.

IBM espera demostrar que puede desarrollar un modelo grande en un dominio particular, que luego se puede entrenar con los datos de propiedad de las organizaciones cliente dentro de ese dominio. Esta sería una mejora importante en términos de costo y sostenibilidad con respecto al enfoque anterior, que implicaba desarrollar un nuevo modelo para cada aplicación.

Diseños de chips más eficientes

Otro campo en el que IBM busca mejorar la eficiencia y la sostenibilidad de la IA y la informática es el diseño de chips. Los grandes modelos de lenguaje se están acercando a la escala de computación que ocurre dentro del cerebro humano, pero usan la misma energía que una ciudad pequeña, mientras que el cerebro usa la misma energía que una bombilla.

Curioni dice que IBM está tomando tres medidas para reducir la demanda de energía de los sistemas avanzados de IA. El primer paso son los chips neuromórficos, como True North de IBM y Loihi, que se modelan más de cerca en las neuronas humanas que los diseños de chips tradicionales. Sus cálculos son menos precisos y más analógicos.

El segundo paso son los memristores, donde el proceso y el almacenamiento de memoria tienen lugar en el mismo chip, lo que reduce la energía gastada en recuperar y restaurar datos entre cálculos.

El tercer paso son las redes neuronales de picos, que transmiten información solo cuando se requiere su función particular, mientras que en los chips tradicionales, cada neurona transmite información todo el tiempo.

Juntos, estos tres pasos pueden conferir mejoras de dos a cuatro órdenes de magnitud en la eficiencia energética.

Avance en la computación cuántica

Es posible que IBM no sea visto actualmente como el líder mundial en IA, pero un campo en el que generalmente se reconoce que está en la primera fila es la computación cuántica, junto con Google y Microsoft. Acaba de anunciar un gran avance en la criptografía cuántica que permitirá que los datos que se transmiten hoy permanezcan seguros, incluso cuando se construyan computadoras cuánticas que puedan descifrar las encriptaciones actuales. Las computadoras cuánticas que ejecutan el algoritmo de Shor pueden factorizar números de manera eficiente y, cuando escalan, podrán factorizar números muy grandes, lo que las máquinas clásicas no pueden hacer en períodos de tiempo razonables.

Lo que han hecho IBM y varios socios académicos es desarrollar un nuevo tipo de cifrado llamado criptografía cuántica segura. Se basa en la criptografía de celosía de alta dimensión y se cree que las computadoras cuánticas no pueden descifrarla. Durante la última década, se llevó a cabo un gran programa de investigación para evaluar muchos tipos potenciales de criptografía cuántica segura y, en julio pasado, surgieron cuatro algoritmos como los más sólidos. Tres de esos cuatro se desarrollaron en el laboratorio de Curioni en Zúrich, y el ganador acaba de ser seleccionado.

El siguiente paso es migrar los datos de las antiguas formas de encriptación a esta nueva forma. Esta tarea se está volviendo urgente. Hubo un susto en diciembre de 2022 cuando un equipo de investigadores chinos anunció que ya habían descubierto cómo violar las tecnologías de encriptación actuales. Su artículo fue apodado el artículo del "apocalipsis cuántico". Rápidamente se dio cuenta de que no habían llegado hasta el final, pero puede que no pase mucho tiempo antes de que alguien lo logre, tal vez tan pronto como dos o tres años. El gobierno de EE. UU. ordenó que todas sus agencias deben ser cuánticas seguras para 2025, y otros gobiernos y empresas están haciendo lo mismo. El gran avance de IBM puede haber llegado justo a tiempo.

Podcast de Futuristas de Londres

Podcast de Futuristas de Londres

Podcast de Futuristas de Londres