Watson es un superordenador de IBM que combina inteligencia artificial (IA) y software analítico sofisticado para un rendimiento óptimo como máquina de «respuesta de preguntas». La supercomputadora lleva el nombre del fundador de IBM, Thomas J. Watson.
La supercomputadora Watson procesa a una velocidad de 80 teraflops (trillones de operaciones de punto flotante por segundo). Para replicar (o superar) la capacidad de respuesta de un humano de alto funcionamiento, Watson accede a 90 servidores con un almacén de datos combinado de más de 200 millones de páginas de información, que procesa contra seis millones de reglas lógicas. El sistema y sus datos son independientes en un espacio con capacidad para 10 refrigeradores.
Los componentes clave de Watson incluyen:
- Marcos de Arquitectura de Gestión de la Información No Estructurada (UIMA) de Apache, infraestructura y otros elementos necesarios para el análisis de datos no estructurados.
- Hadoop de Apache, un marco de programación gratuito basado en Java que admite el procesamiento de grandes conjuntos de datos en un entorno de computación distribuida.
- SUSE Enterprise Linux Server 11, el sistema operativo de procesador Power7 más rápido disponible.
- 2.880 núcleos de procesador.
- 15 terabytes (TB) de RAM.
- 500 gigabytes (GB) de información preprocesada.
- El software DeepQA de IBM, diseñado para la recuperación de información que incorpora procesamiento de lenguaje natural (PNL) y aprendizaje automático.
Las aplicaciones para la tecnología de computación cognitiva subyacente de Watson son casi infinitas. Debido a que el dispositivo puede realizar minería de texto y análisis complejos en grandes volúmenes de datos no estructurados, puede admitir un motor de búsqueda o un sistema experto con capacidades muy superiores a cualquier sistema existente anteriormente.
En mayo de 2016, BakerHostetler, un bufete de abogados con sede en Ohio, firmó un contrato para que un sistema de expertos legales basado en Watson trabajara con su equipo de quiebras de 50 personas. Ese sistema, llamado Ross, puede extraer datos de cerca de mil millones de documentos de texto, analizar la información y proporcionar respuestas precisas a preguntas complicadas en menos de tres segundos. El procesamiento del lenguaje natural permite que el sistema traduzca jerga legal para responder a las preguntas de los abogados.
A medida que los creadores de Ross agregan más módulos legales, sistemas expertos similares están transformando la investigación médica.
Watson en el sector sanitario
El sector sanitario fue una de las primeras industrias a las que se aplicó la tecnología Watson. La primera implementación comercial de Watson se produjo en 2013, cuando el Memorial Sloan Kettering Cancer Center comenzó a usar el sistema para recomendar opciones de tratamiento para pacientes con cáncer de pulmón para garantizar que recibieran el tratamiento adecuado y reducir los costos. Desde entonces, proveedores como Cleveland Clinic, Maine Center for Cancer Medicine y Westmed Medical Group también han implementado herramientas Watson.
Sin embargo, no todas las implementaciones han ido bien. El MD Anderson Cancer Center en Houston lanzó un proyecto en 2013 para construir un sistema de apoyo a la toma de decisiones con tecnología Watson para ayudar a los médicos a determinar las mejores opciones de tratamiento. Pero después de gastar más de 6 62 millones en el proyecto en el transcurso de cuatro años, los administradores del hospital cancelaron el proyecto, diciendo que no había cumplido con sus metas.
La asistencia sanitaria sigue siendo un punto focal principal para IBM, ya que trata de probar la tecnología Watson, y la compañía continúa forjando asociaciones con organizaciones de asistencia sanitaria. En mayo de 2018, por ejemplo, el mayor sistema de atención médica especializada de la India, Apollo, acordó adoptar Watson para Oncología y Watson para Genómica. Las dos plataformas de computación cognitiva de IBM ayudarán a los médicos a tomar decisiones para la atención personalizada del cáncer.
El uso de Watson por parte de IBM para resolver algunos de los mayores problemas relacionados con la atención al paciente y el uso de información basada en datos para recomendar opciones de tratamiento demostraría el valor de las tecnologías Watson.
Watson Analytics
Watson Analytics es una de las principales implementaciones de la tecnología Watson. Es una plataforma para explorar, visualizar y presentar datos que utiliza las capacidades cognitivas de Watson para mostrar información basada en datos de forma automática y recomendar formas de presentar los datos.
La plataforma se compone de un componente de exploración, que permite a los usuarios cargar sus datos, recomendar automáticamente variables potencialmente correlacionadas y construir comparaciones; una herramienta de predicción que permite a los usuarios obtener respuestas a preguntas complejas basadas en sus datos; y una herramienta de informes que admite el desarrollo de paneles e informes.
Se accede a cada componente mediante una interfaz gráfica de usuario (GUI), que minimiza la necesidad de formación avanzada en ciencia de datos. La plataforma está diseñada para que los trabajadores con conocimientos técnicos limitados puedan acceder a análisis avanzados. El costo de Watson Analytics depende de la versión; hay una versión gratuita que incluye la capacidad de cargar hojas de cálculo, obtener visualizaciones, obtener información y crear paneles de control. La edición «Plus» incluye las capacidades de la versión gratuita junto con 2 GB de almacenamiento y fuentes de datos, incluidas las bases de datos, a partir de $30 por usuario al mes. Una edición «Profesional» con todas las características anteriores, así como un inquilino multiusuario para colaborar, 100 GB de almacenamiento y más datos, cuesta 8 80 o más por usuario al mes. (precios de 2018 obtenidos del sitio web de IBM Watson Analytics).
Las API de Watson permiten a las empresas crear aplicaciones de IA
IBM ha publicado una gama de interfaces de programas de aplicaciones (API) en su nube que permiten a los usuarios crear sus propias aplicaciones de IA que utilizan la tecnología principal de Watson en el back-end. Hay API que admiten marcos de desarrollo populares como Java, Python y otros.
IBM también tiene conectores API para algoritmos de aprendizaje profundo previamente entrenados que permiten a los usuarios crear aplicaciones para cosas como procesamiento de lenguaje natural, reconocimiento de imágenes y análisis de tonos. Una API es compatible con el desarrollo de asistentes inteligentes que utilizan la tecnología Watson en el back-end.
Historia de IBM Watson
En un artículo de la revista AI de otoño de 2010, investigadores de IBM informaron sobre su viaje de tres años para construir un sistema informático que pudiera competir con los humanos para responder preguntas correctamente en tiempo real en el programa de televisión Jeopardy! Este proyecto llevó al diseño de la arquitectura DeepQA y Watson de IBM.
En 2011, Watson desafió a dos de los mejores jugadores en Jeopardy! — los campeones Ken Jennings y Brad Rutter fam y los vencieron. El avatar Watson se sentó entre los dos concursantes, como lo haría un competidor humano, mientras que su considerable masa se sentó en un piso diferente del edificio. Como los otros concursantes, Watson no tenía acceso a Internet.
En la ronda de práctica, Watson demostró una habilidad similar a la humana para los juegos de palabras complejos, respondiendo correctamente, por ejemplo, a la pista de respuesta, «Barra de caramelo clásica que es una jueza de la Corte Suprema», con: «¿Qué es la bebé Ruth Ginsburg? Rutter señaló que aunque la recuperación de información es «trivial» para Watson y difícil para un humano, el humano es aún mejor en la compleja tarea de la comprensión. Sin embargo, el aprendizaje automático le permite a Watson examinar sus errores contra las respuestas correctas para ver dónde se equivocó e informar respuestas futuras.
Los investigadores de IBM concluyeron que DeepQA demostró ser una arquitectura eficaz y extensible que se podía utilizar para combinar, desplegar, evaluar y avanzar en una amplia gama de técnicas algorítmicas en el campo de la respuesta a preguntas.