El gigante de internet adquirió hace un par de años DeepMind, la empresa dueña de una tecnología orientada a hacer que los ordenadores logren pensar como los humanos, algo que se ha aplicado especialmente al campo de los videojuegos. En los últimos años, esta tecnología ha dado frutos increíbles, como la victoria frente al campeón mundial de Go a manos AlphaGo.
Pues bien, tal parece que los investigadores de DeepMind crearon un ordenador neuronal diferenciable (DNC por sus siglas en inglés), capaz de resolver problemas, sin tener conocimientos previos de los mismos. En otras palabras, el DNC utiliza la capacidad de almacenamiento de los ordenadores convencionales y la combina con un sistema informático de red neuronal.
Al igual que el cerebro, la red neuronal utiliza una serie interconectada de nodos estimulando los centros específicos necesarios para completar una tarea. En este caso, la inteligencia artificial es la optimización de los nodos para encontrar la solución más rápida para entregar el resultado deseado.
Las capacidades de DeepMind

Con este avance, la plataforma DeepMind ahora es capaz de resolver situaciones como planificar la mejor ruta entre estaciones del metro de Londres, o elaborar relaciones entre parientes en árboles genealógicos. Incluso, el sistema es capaz de solucionar un juego de puzzle de bloques utilizando el aprendizaje por refuerzo.
"Cuando diseñamos DNC, queríamos máquinas capaces de aprender a navegar y formar estructuras complejas de datos por su cuenta. En el corazón de un DNC hay una red neural llamada controlador, que es responsable de tomar la entrada, leer y escribir en la memoria, y producir lo que puede ser interpretado como una respuesta", indicaron Alexander Graves y Greg Wayne, investigadores de DeepMind.
De esta manera, en lugar de tener que aprender cada resultado posible para encontrar una solución, DeepMind puede encontrar una respuesta basándose en su experiencia previa, desenterrando lo que necesita saber de su propia memoria interna. Incluso se puede decir que fue este mismo proceso con el que DeepMind pudo vencer a un campeón humano en 'Go', un juego con millones de movimientos y un número infinito de combinaciones.
Vía | DeepMind Technologies
Ver 9 comentarios
9 comentarios
juanmcm
El reportaje en sí parece una cosa pero el titular dice otra, o eso parece.
Dice que no necesita de los humanos, pero en el artículo dice que aprende por refuerzo o la experiencia, así como que aprende de nosotros por lo que se podría entender que no lo hace directamente, si fijándose en nosotros.
No me impresionan los avances en este campo pero si que me preocupan los avances sin aplicación real o cuando no queda claro que esperan conseguir con los mismos.
Es decir, los avances en si no me preocupan, pero si cuando hay posibilidades de quitar a los humanos de ciertos trabajos o quitar mano de obra o quizás emplearlo con fines bélicos.
Pablosar
Cada vez sorprenden mas los avances en esta materia... y esto solo está empezando.
ilwp
Ciertamente me encantaría estar mas informado sobre la realidad y los procesos de IA, pero una cosa es querer y otra poder.
Y eso es lo que me desde mi desconocimiento creo que le pasa a la IA.
Hace ya muchos años que vimos todos como la maquinita de IBM ganaba o lo intentaba al ajedrez al mejor ajedrecista del momento. (Creo que kasparov o algo así) y muchos años después nos dicen que otra maquinita ha ganado a otro humano en otro juego.
Vale, si, mas complejo, Pero es que han tenido tiempo para crear el algoritmo adecuado (que se lo dan humanos a una maquina, no lo aprendió sola) y también ha crecido exponencialmente la potencia de calculo del hardware.
Tengo la sensación de que es el mismo perro con otro collar.
Es mi apreciación.
whisper5
El titular me parece engañoso. Tanto el titular como el texto dan a entender que el sistema informático que ha creado DeepMind es capaz de aprender por sí mismo y no es cierto. En algunos casos comparan la respuesta del sistema DNC con la respuesta correcta (algo externo al sistema) y en otros utilizan una técnica denominada 'reinforcement learning' según la cual a cada respuesta generada por el sistema mientras aprende se le asigna (y esto es externo, no lo hace el sistema) un valor que indica lo buena o mala que es la respuesta, y es este valor el que entrena la red neuronal, corrigiéndola hasta que la validez de las respuestas alcanza un valor máximo.
Así como otras redes neuronales se utilizan para aprender a reconocer imágenes, DNC se utiliza para aprender a escribir y leer información en una memoria de tal forma que sea útil para contestar preguntas para las que se le entrena.