Cómo los científicos utilizan la inteligencia artificial
Ya está haciendo que la investigación sea más rápida, mejor y más productiva.
En 2019 , los científicos del Instituto Tecnológico de Massachusetts ( mit ) hicieron algo inusual en la medicina moderna: encontraron un nuevo antibiótico, la halicina. En mayo de este año, otro equipo encontró un segundo antibiótico, la abaucina. Lo que destacó a estos dos compuestos no fue sólo su potencial para su uso contra dos de las bacterias resistentes a los antibióticos más peligrosas que se conocen, sino también cómo fueron identificados.
En ambos casos, los investigadores habían utilizado un modelo de inteligencia artificial ( ia ) para buscar entre millones de compuestos candidatos e identificar aquellos que funcionarían mejor contra cada "superbacteria". El modelo había sido entrenado con las estructuras químicas de unos pocos miles de antibióticos conocidos y qué tan bien (o no) habían funcionado contra los insectos en el laboratorio. Durante este entrenamiento, el modelo había descubierto los vínculos entre las estructuras químicas y el éxito en la destrucción de bacterias. Una vez que la ia escupió su lista corta, los científicos los probaron en el laboratorio e identificaron sus antibióticos. Si descubrir nuevos medicamentos es como buscar una aguja en un pajar, dice Regina Barzilay, científica informática del mit que ayudó a encontrar la abaucina y la halicina, aiActúa como un detector de metales. Para llevar los medicamentos candidatos del laboratorio a la clínica se necesitarán muchos años de ensayos médicos. Pero no hay duda de que la ia aceleró la parte inicial de prueba y error del proceso. Cambia lo que es posible, afirma el Dr. Barzilay. Con la ia , "el tipo de preguntas que haremos será muy diferente de las que hacemos hoy".
El descubrimiento de fármacos no es el único que se ve afectado por el potencial de la ia . Los investigadores que abordan muchos de los problemas más complicados e importantes del mundo (desde la previsión meteorológica hasta la búsqueda de nuevos materiales para baterías y paneles solares y el control de reacciones de fusión nuclear) están recurriendo a la IA para aumentar o acelerar su progreso .
El potencial es enorme. “ la ia podría marcar el comienzo de un nuevo renacimiento del descubrimiento”, sostiene Demis Hassabis, cofundador de Google DeepMind, un laboratorio de ia con sede en londres, “actuando como un multiplicador del ingenio humano”. Ha comparado la ia con el telescopio, una tecnología esencial que permitirá a los científicos ver más lejos y comprender más que a simple vista.
Aunque ha sido parte del conjunto de herramientas científicas desde la década de 1960, durante la mayor parte de su vida la ia ha estado estancada en disciplinas donde los científicos ya estaban bien versados en códigos informáticos: la física de partículas, por ejemplo, o las matemáticas. Sin embargo, para 2023, con el auge del aprendizaje profundo, más del 99% de los campos de investigación estaban produciendo resultados relacionados con la ia , según csiro , la agencia científica de Australia (ver gráfico). "La democratización es lo que está provocando esta explosión", afirma Mark Girolami, científico jefe del Instituto Alan Turing de Londres. Lo que antes requería un título en informática y líneas de lenguajes de programación arcanos ahora se puede hacer con herramientas de inteligencia artificial fáciles de usar , que a menudo funcionan después de una consulta en Chat gpt ., Abra el chatbot de ai . Por lo tanto, los científicos tienen fácil acceso a lo que es esencialmente un asistente de investigación tenaz y sobrehumano que resolverá ecuaciones y examinará incansablemente enormes montones de datos para buscar patrones o correlaciones en su interior.
En la ciencia de los materiales, por ejemplo, el problema es similar al del descubrimiento de fármacos: existe una cantidad insondable de compuestos posibles. Cuando los investigadores de la Universidad de Liverpool buscaban materiales que tuvieran las propiedades muy específicas necesarias para construir mejores baterías, utilizaron un modelo de inteligencia artificial conocido como "autocodificador" para buscar entre los 200.000 compuestos cristalinos estables conocidos en la materia inorgánica. Crystal Structure Database, el repositorio de este tipo más grande del mundo. La iaHabía aprendido previamente las propiedades físicas y químicas más importantes necesarias para que el nuevo material de la batería alcanzara sus objetivos y aplicó esas condiciones a la búsqueda. Redujo con éxito el grupo de candidatos que los científicos pueden probar en el laboratorio de miles a solo cinco, ahorrando tiempo y dinero.
El candidato final, un material que combina litio, estaño, azufre y cloro, era novedoso, aunque es demasiado pronto para decir si funcionará o no comercialmente. Sin embargo, los investigadores están utilizando el método de la ia para descubrir otros tipos de materiales nuevos.
¿Qué soñaste?
la ia también se puede utilizar para predecir. Las formas en que se retuercen las proteínas después de formarse en una célula son vitales para que funcionen. Los científicos aún no saben cómo se pliegan las proteínas. Pero en 2021, Google DeepMind desarrolló AlphaFold, un modelo que había aprendido por sí solo a predecir la estructura de una proteína únicamente a partir de su secuencia de aminoácidos. Desde su lanzamiento, AlphaFold ha producido una base de datos de más de 200 millones de estructuras de proteínas predichas, que ya ha sido utilizada por más de 1,2 millones de investigadores. Por ejemplo, Matthew Higgins, bioquímico de la Universidad de Oxford, utilizó AlphaFold para descubrir la forma de una proteína en los mosquitos que es importante para el parásito de la malaria que los insectos suelen portar. Luego pudo combinar las predicciones de AlphaFold para determinar qué partes de la proteína serían las más fáciles de atacar con un fármaco. Otro equipo utilizó AlphaFold para encontrar, en sólo 30 días, la estructura de una proteína que influye en la proliferación de un tipo de cáncer de hígado, abriendo así la puerta al diseño de un nuevo tratamiento dirigido.
AlphaFold también ha contribuido a la comprensión de otros aspectos de la biología. El núcleo de una célula, por ejemplo, tiene puertas para introducir material para producir proteínas. Hace unos años, los científicos sabían que las puertas existían, pero sabían poco sobre su estructura. Utilizando AlphaFold, los científicos predijeron la estructura y contribuyeron a comprender los mecanismos internos de la célula. "Realmente no entendemos completamente cómo [la ia ] llegó a esa estructura", dice Pushmeet Kohli, uno de los inventores de AlphaFold que ahora dirige el equipo " ia para la ciencia" de google deepmind. "Pero una vez que se ha creado la estructura, en realidad es una base sobre la que ahora toda la comunidad científica puede construir".
la ia también está resultando útil para acelerar simulaciones informáticas complejas. Los modelos meteorológicos, por ejemplo, se basan en ecuaciones matemáticas que describen el estado de la atmósfera terrestre en un momento dado. Los superordenadores que pronostican el tiempo , sin embargo, son caros, consumen mucha energía y requieren mucho tiempo para realizar sus cálculos. Y los modelos deben ejecutarse una y otra vez para mantenerse al día con el flujo constante de datos de las estaciones meteorológicas de todo el mundo.
Por lo tanto, los científicos del clima y las empresas privadas están comenzando a implementar el aprendizaje automático para acelerar las cosas. Pangu-Weather, una ia creada por Huawei, una empresa china, puede hacer predicciones sobre el tiempo con una semana de antelación miles de veces más rápido y más barato que el estándar actual, sin ninguna caída significativa en la precisión. FourCastNet, un modelo creado por Nvidia, un fabricante de chips estadounidense, puede generar dichos pronósticos en menos de dos segundos y es el primer modelo de inteligencia artificial que predice con precisión la lluvia con una alta resolución espacial, lo cual es información importante para predecir desastres naturales como inundaciones repentinas. . Ambas iaLos modelos se entrenan para predecir el clima aprendiendo de datos de observación o de los resultados de simulaciones de supercomputadoras. Y son solo el comienzo: Nvidia ya ha anunciado planes para construir un gemelo digital de la Tierra, llamado "Tierra-2", un modelo informático que la compañía espera pueda predecir el cambio climático a un nivel más regional, dentro de varias décadas. avance.
Mientras tanto, los físicos que intentan aprovechar el poder de la fusión nuclear han estado utilizando ia.para controlar partes complejas del kit. Un enfoque para la investigación de la fusión implica la creación de un plasma (un gas sobrecalentado y cargado eléctricamente) de hidrógeno dentro de un recipiente con forma de rosquilla llamado tokamak. Cuando están lo suficientemente calientes, alrededor de 100 m°C, las partículas del plasma comienzan a fusionarse y liberar energía. Pero si el plasma toca las paredes del tokamak, se enfriará y dejará de funcionar, por lo que los físicos contienen el gas dentro de una jaula magnética. Encontrar la configuración correcta de los campos magnéticos es endiabladamente difícil (“un poco como intentar sujetar un trozo de gelatina con lana de tejer”, según un físico) y controlarlo manualmente requiere idear ecuaciones matemáticas para predecir lo que hará el plasma y luego fabricar miles de pequeños ajustes cada segundo en unas diez bobinas magnéticas diferentes. Por el contrario, una iaEl sistema de control construido por científicos de Google DeepMind y epfl en Lausana, Suiza, permitió a los científicos probar diferentes formas para el plasma en una simulación por computadora, y luego la ia descubrió la mejor manera de llegar allí.
La automatización y aceleración de experimentos físicos y trabajos de laboratorio es otra área de interés . Los “laboratorios autónomos” pueden planificar un experimento, ejecutarlo utilizando un brazo robótico y luego analizar los resultados. La automatización puede hacer que el descubrimiento de nuevos compuestos o la búsqueda de mejores formas de producir compuestos antiguos sea hasta mil veces más rápido.
Has estado en el tubo
la ia generativa , que irrumpió en la conciencia pública con la llegada de Chat gpt en 2022 pero con la que los científicos llevan mucho más tiempo jugando, tiene dos usos científicos principales. En primer lugar, se puede utilizar para generar datos. los modelos de ia de “súper resolución” pueden mejorar imágenes de microscopio electrónico baratas y de baja resolución para convertirlas en imágenes de alta resolución que de otro modo habrían sido demasiado costosas de registrar. La ia compara una pequeña área de un material o una muestra biológica en alta resolución con lo mismo grabado en una resolución más baja. El modelo aprende la diferencia entre las dos resoluciones y luego puede traducir entre ellas.
Y así como un modelo de lenguaje grande ( llm ) puede generar oraciones fluidas al predecir la siguiente mejor palabra en una secuencia, los modelos moleculares generativos pueden construir moléculas, átomo por átomo, enlace por enlace. llmUsamos una combinación de estadísticas autodidactas y billones de palabras de textos de capacitación seleccionados de Internet para escribir de manera que imiten plausiblemente a un ser humano. Los modelos de “diseño molecular de novo”, formados en vastas bases de datos de fármacos conocidos y sus propiedades, pueden determinar qué estructuras moleculares tienen más probabilidades de hacer qué cosas y se construyen en consecuencia. Verseon, una compañía farmacéutica con sede en California, ha creado candidatos a fármacos de esta manera, varios de los cuales ahora se están probando en animales y uno, un anticoagulante de precisión, se encuentra en la primera fase de ensayos clínicos. Al igual que los nuevos antibióticos y materiales para baterías identificados por la ia , los productos químicos diseñados mediante algoritmos también deberán someterse a los ensayos habituales en el mundo real antes de poder evaluar su eficacia.
Un uso más futurista para los llm proviene de Igor Grossmann, psicólogo de la Universidad de Waterloo. Si a un llm se le pudieran presentar historias reales (o inventadas) para reflejar con precisión lo que los participantes humanos podrían decir, teóricamente podrían reemplazar a los grupos focales o usarse como agentes en la investigación económica. los llm podrían entrenarse con varias personas diferentes, y su comportamiento podría luego usarse para simular experimentos, cuyos resultados, si son interesantes, podrían confirmarse más tarde con sujetos humanos.
los llm ya están haciendo que los propios científicos sean más eficientes. Según GitHub, el uso de herramientas como "Copilot" puede ayudar a los programadores a escribir software un 55% más rápido. Para todos los científicos, leer los antecedentes de la investigación en un campo antes de embarcarse en un proyecto puede ser una tarea desalentadora: la magnitud de la literatura científica moderna es demasiado vasta para que una persona pueda manejarla. Elicit, una herramienta gratuita de inteligencia artificial en línea creada por Ought, un laboratorio de investigación estadounidense sin fines de lucro, puede ayudar mediante el uso de un llm a revisar las montañas de literatura de investigación y resumir las importantes mucho más rápido que cualquier humano. Ya lo utilizan estudiantes y científicos más jóvenes, muchos de los cuales lo encuentran útil para encontrar artículos que citar o definir una dirección de investigación frente a una montaña de texto. llmLos s pueden incluso ayudar a extraer información estructurada (como cada experimento realizado con un fármaco específico) de millones de documentos.
la ia también podría lograr ampliar el acceso al conocimiento dentro de las disciplinas . Cada detector del Gran Colisionador de Hadrones del cern en Ginebra requiere sus propios equipos especializados de operadores y analistas. Combinar y comparar datos de ellos es imposible sin que los físicos de cada detector se reúnan para compartir su experiencia. Esto no siempre es factible para los físicos teóricos que quieren probar rápidamente nuevas ideas. Por lo tanto, Miguel Arratia, físico de la Universidad de California en Riverside, ha propuesto utilizar la ia para integrar mediciones de múltiples experimentos de física fundamental (e incluso observaciones cosmológicas) para que los físicos teóricos puedan explorar, combinar y reutilizar rápidamente los datos por su cuenta. trabajar.
los modelos de ia han demostrado que pueden procesar datos y automatizar cálculos y algunos trabajos de laboratorio (ver tabla). Pero el Dr. Girolami advierte que, si bien la ia podría ser útil para ayudar a los científicos a llenar vacíos de conocimiento, los modelos aún luchan por ir más allá de los límites de lo que ya se sabe. Estos sistemas son buenos para la interpolación (conectar los puntos), pero no tanto para la extrapolación, imaginando dónde podría ir el siguiente punto.
Y hay algunos problemas difíciles que ni siquiera los sistemas de inteligencia artificial más exitosos de la actualidad aún no pueden resolver. AlphaFold, por ejemplo, no obtiene todas las proteínas correctamente todo el tiempo. Jane Dyson, bióloga estructural del Instituto de Investigación Scripps en La Jolla, California, dice que para las proteínas "desordenadas", que son particularmente relevantes para su investigación, las predicciones de la ia son en su mayoría basura. "No es una revolución que deje a todos nuestros científicos sin trabajo". Y AlphaFold aún no explica por qué las proteínas se pliegan como lo hacen. Aunque tal vez la ia "tiene una teoría que simplemente no hemos podido comprender todavía", dice el Dr. Kohli.
A pesar de esas limitaciones, los biólogos estructurales todavía consideran que AlphaFold ha hecho su trabajo más eficiente. La base de datos repleta de predicciones de proteínas de AlphaFold permite a los científicos determinar la estructura probable de una proteína en unos pocos segundos, a diferencia de los años y decenas de miles de dólares que habrían requerido de otra manera. Según Google DeepMind, los científicos que utilizan AlphaFold publican alrededor de un 20% más de artículos que aquellos del mismo campo que no lo hacen.
Y acelerar el ritmo de la investigación y los descubrimientos científicos, logrando eficiencias siempre que sea posible, es muy prometedor. En un informe reciente sobre la ia en la ciencia, la ocde , un club de países ricos, dijo que “si bien la ia está penetrando en todos los dominios y etapas de la ciencia, su pleno potencial está lejos de realizarse”. El premio, concluyó, podría ser enorme: “Acelerar la productividad de la investigación podría ser el uso más valioso económica y socialmente de todos los usos de la inteligencia artificial”.
Bienvenido a la máquina
Si las herramientas de ia logran aumentar la productividad de la investigación, el mundo sin duda obtendría el “multiplicador del ingenio humano” predicho por el Dr. Hassabis. Pero la ia tiene aún más potencial: así como los telescopios y microscopios permiten a los científicos ver más mundo, los modelos probabilísticos basados en datos utilizados en la ia permitirán cada vez más a los científicos modelar y comprender mejor los sistemas complejos. Campos como la ciencia del clima y la biología estructural ya se encuentran en un punto en el que los científicos saben que están ocurriendo procesos complicados, pero hasta ahora los investigadores han tratado principalmente de comprender esos temas utilizando reglas, ecuaciones y simulaciones de arriba hacia abajo. aiEn cambio, puede ayudar a los científicos a abordar los problemas desde abajo hacia arriba: medir muchos datos primero y usar algoritmos para generar reglas, patrones, ecuaciones y comprensión científica más adelante.
Si en los últimos años los científicos han visto a los científicos sumergirse en las aguas poco profundas de la ia , la próxima década y más allá será cuando tendrán que sumergirse en sus profundidades y nadar hacia el horizonte.