Anthropic deja en ridículo a ChatGPT: su chatbot Claude es capaz de leer una novela en menos de un minuto

26 comentarios Facebook Twitter E-mail

12 Mayo 2023 Actualizado 12 Mayo 2023, 13:50

Javier Pastor

Es la gran tapada del mundo de la IA. Anthropic, es una startup que fue fundada por exingenieros de OpenAI que se fueron descontentos de aquella. Sus avances han atraído el interés de Google —que ha invertido 400 millones de dólares en ella— y han cristalizado con Claude, un chatbot que ahora está haciendo morder el polvo a ChatGPT y a GPT-4. ¿Cómo? Leyendo mucho.

Cuantos más tokens, mejor. Los modelos de IA conversacionales actuales son mejores cuanta más información son capaces de absorber en cada consulta. Es el llamado contexto (o ventana de contexto), y se mide en tokens, unidades básicas en las que se divide la información que "capta" el modelo. Un token puede equivaler a una palabra, pero suele también equivaler a un pequeño grupo de palabras. Google Bard tiene un límite de 2K tokens —ese parece ser también el tope para Bing Chat—, GPT-3 y ChatGPT admiten 4K, y GPT-4 trabaja de serie con un límite de 8K, pero hay una versión de este último que llega a los 32K tokens.

En Xataka

GPT-4 ya era un salto gigantesco respecto a ChatGPT. GPT-4 a 32K sencillamente cambia las reglas del juego

Claude 1, GPT-4 0. Sin embargo en Anthropic han dado un salto brutal en este apartado. La "ventana de contexto" de Claude era de 9K tokens, pero ahora han hecho que sea posible soportar ventanas de 100K tokens, lo que según la empresa permite que en un solo prompt se puedan introducir unas 75.000 palabras. ¿Qué significa eso?

"Claude, léete esta novela de un tirón". La forma más sencilla de entenderlo es destacando que Claude es capaz de leerse una novela en segundos, y a partir de ahí, contestar a cualquier pregunta sobre esa novela. Con ChatGPT tendríamos que introducir la novela en pequeños fragmentos, y no es nada trivial hacer que luego todos esos fragmentos sean considerados como un texto único para luego hacer preguntas. Es lo que GPT-4 facilita con ese límite superior de 32K, pero Anthropic va mucho más allá con Claude.

Las empresas se frotan las manos. Esto es particularmente interesante para las empresas, que podrán acudir a Claude para introducir (¿aburridos?) documentos de decenas (e incluso centenares) de páginas con multitud de datos sobre los que luego podremos realizar todo tipo de peticiones. Claude podrá resumirlos, extraer tablas y conclusiones o generar ideas a partir de él. Será como tener un analista o consultor robótico listo para devorar datos y extraer ideas, información y conclusiones.

También consume audio. No solo eso: esa ventana de contexto también vale para el audio. Esos 100K tokens hacen que Claude pueda "consumir" un podcast de unas 6 horas. Lo hizo AssemblyAI, que transcribió un larguísimo episodio que dio como resultado 58K palabras y que Claude luego resumió a la perfección.

Y, cómo no, código. Lo mismo ocurre con esa ventaja en el caso de los desarrolladores. Los programadores podrán por ejemplo dar como entrada un proyecto software completo, o también hacer que Claude se lea 240 páginas de documentación de una API para luego comenzar a hacer preguntas sobre ella.

Imagen: Javier Pastor con Bing Image Creator.

En Xataka | 22 funciones y cosas que puedes hacer con ChatGPT para exprimir al máximo esta inteligencia artificial

Temas

Comentarios cerrados

Ver 24 comentarios

24 comentarios

brillante

Mr. Dick

* * *

12 May. 2023, 12:59

4

DotCSV, un youtuber divulgador de ML ha tenido acceso a esta IA y le ha metido el paper entero de GPT4, metiendo entre medios un mensaje relacionado a las patatas fritas para después preguntarle si se mencionaban en alguna parte del documento.
¿La respuesta del modelo? Que no se hacía.
Es un modelo que está resumiendo y priorizando información. Lo cual modelos open source ya hacen.
No deja en ridículo a nadie porque se sigue olvidando (más bien deja de prestar atención) de cosas en cuanto llega al límite real del propio modelo. Justo como hace ChatGPT. Solo que a diferencia del primero, GPT4 si que tiene un contexto REAL mayor y hay gente que ya está teniendo acceso a este. Otro título sensacionalista para subirse al tren del hype y tener mejor SEO.
Que ojo, el método que utiliza Anthropic es probablemente mejor que el de ChatGPT para según que preguntas. Pero esos no son tokens reales y desde luego no deja a ridículo a nadie. Mucho menos a un modelo bastante más inteligente.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 7 votos, karma: 130 Vota positivo Vota negativo
7

Comentario moderado
Respondiendo a Webserveis

Mr. Dick

* * *

12 May. 2023, 13:21

8

Si algo tiene bueno Twitter (obviando toda la mierda) es que hay nichos de usuarios de todo tipo. Incluyendo expertos de la materia, y que siguiendo a unas cuantas cuentas te enteras en tiempo real de todo lo que los propios investigadores y expertos del campo debaten. Y uno de esos debates: era si PaLM 2 era igual o mejor que GPT4.
El consenso general por ahora es que no es el caso, y que aunque es muy bueno, es más una respuesta a GPT3.5 (davinci-3) que a GPT4. Probablemente no sea hasta Gemini, su siguiente modelo, que tengamos una alternativa a GPT4.
Por lo que si, probablemente no haya nada mejor que este modelo en el mercado en estos momentos. Y probablemente no lo haya en el futuro próximo, teniendo en cuenta que OpenAI lleva ella sola comiéndose todo el feedback de los usuarios desde diciembre del año pasado. Que si os parece poco, solo tenéis que comparar Stable Diffusion con Midjourney y ya veréis cuanto hace la diferencia este.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 0 Vota positivo Vota negativo
9

Comentario moderado
Respondiendo a Webserveis

Mr. Dick

* * *

12 May. 2023, 13:40

10

Midjourney es un grupo pequeño de personas (creo que eran 14). Es entendible que no tengan el potencial necesario para crear todo un ecosistema que permita mayor control al usuario.
Pero por el otro lado, tenemos Adobe Firefly. Que no solo tienen un montón de material completamente libre de problemas de copyright, si no que encima ahora tiene soporte de Google. Yo creo que a menos que alguien más se ponga las pilas este será el caballo ganador a la larga.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 30 Vota positivo Vota negativo
Respondiendo a Mr. Dick

asdfgh2

* *

13 May. 2023, 10:53

21

Yo por lo que he ido viendo PaLM 2 y GPT4 están prácticamente a la par, en algún benchmark uno es mejor que otro, y viceversa, y en algún campo PaLM2 da mejores resultados (traducción o matemática) y viceversa con GPT4 (código). Aunque las comparativas hechas según lo que ve un humano son susceptibles y sujetas a contaminación del del fine-tuning.
Al final PaLM 2 y GPT4 se basa en el mismo modelo de aprendizaje (que se estreno con PaLM) con la diferencia de que para PaLM 2 y GPT4 se han usado muchísimo mas datos para el entrenamiento y son lo responsables directos de la calidad del modelo.
Sin embargo yo diría que el objetivo de PaLM 2 no era ser mejor que GPT4 sino ser barato, maleable y eficiente. Google tiene un montón de sitios en el que poner AI y no es viable tener un modelo super bueno pero super caro de ejecutar como es GPT4.
Gemini, será la siguiente evolución en cuanto a generación de modelos.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a Mr. Dick

asdfgh2

* *

13 May. 2023, 10:26

20

Pero si es un toque atención importante. Porque aunque excluya información la ventana que maneja Claude sigue siendo de 3 veces la de GPT4 en su versión grande.
La relevancia de Open AI a largo plazo depende de lo rápido que puedan construir ecosistema con usuarios y empresas que paguen, y eso lo consiguen mantiendose en el foco como los mejores. En mi opinión la velocidad que ha tomado el asunto en otras empresas y startups hace que se tambalee dicha posición. Porque si PaLM 2 y GPT4 están según como mires a la par, pero el primero es mucho mas barato de ejecutar y desplegar, ya puede ser el mejor el segundo que el elegido será el primero.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
interesante

Ladderman

* *

12 May. 2023, 13:04

5

De poco vale que se lea la novela si después se inventa la respuesta a las preguntas. Tiene que ser un problema de difícil solución y de fondo para todos los modelos de IA porque no he visto todavía a nadie salir a decir que lo de la información inventada iba a ser cosa del pasado con la nueva versión que iban a lanzar.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 3 votos, karma: 65 Vota positivo Vota negativo
Respondiendo a Ladderman

Usuario desactivado

12 May. 2023, 18:58

14

+1.al fin alguien que no se traga que estas IAs sean de verdad inteligentes.
Menú
Respondiendo a Usuario desactivado

Ladderman

* *

13 May. 2023, 14:18

23

Es que yo ya he visto y he hecho experimentos, y hay detalles graciosísimos de ChatGPT que creo que muestran las limitaciones del modelo probabilística que se usa actualmente. Era facilísimo, con ChatGPT 3.5, entrar y poner: "¿Conoces a Miguel Rodríguez, el cómico?" y acabarse tragando una biografía completamente inventada porque el modelo asumía que tú querías una respuesta afirmativa; en cambio, si le escribías "habláme de Míguel Rodríguez, el cómico" lo normal era que te dijese que no sabía quien era. Algo tan en apariencia irrelevante como la formulación de la pregunta alteraba por completo la respuesta. No he podido hacer pruebas personalmente con la 4, pero por lo que le he visto a otros es algo que sigue pasando.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a Ladderman

Cufloc

* *

14 May. 2023, 15:17

24

Yo he hecho pruebas y falla como una escopeta de feria.
Mi favorita es: Asumiendo que ninguna guerra se solape entre sí, ¿Cuántos años ha estado EEUU en guerra? Me respondió que 120 y algo, que el 19% de su historia
En primer lugar EEUU se fundó en 1776, tiene 247 años. 120 es casi el 50% de 247.
En segundo lugar lo calculé a mano (con la lista de guerras de Wikipedia) y me salen 556 años en guerra.
Todo mal
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a Ladderman

javierverdugo

* *

12 May. 2023, 19:03

17

Por eso es importante usarla la IA en un contexto que tú conoces.
A mi me sirve para aprender a programar, o aprender ciertos programas.
Se inventa cosas, pero la otra mitad es correcta, lo que conlleva a que tu puedes ir "educándole" e ir mejorando su respuesta inicial.
Para mi es mejor en algunos casos que buscar una solución a un problema en google a través de los foros. A veces cuesta mucho dar con un problema concreto, en cambio con ChatGpt es más personalizado.
Creo que estamos avanzando hacia una "pseudo IA" buscador google 3.0, que si bien como dices no es realmente inteligente, es un modelo muy superior a lo actual. Del mismo modo que cuando surgió Google vs otros buscadores arcaicos como Hispavista o Yahoo.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
Respondiendo a javierverdugo

Ladderman

* *

13 May. 2023, 14:12

22

A ver, tengo amigos informáticos y ya me han comentado que ellos en sus pruebas se ahorran tiempo usando ChatGPT para generar cierto código, lo que pasa es que ellos saben lo que quieren y tienen clarísimo cuando la ha liado.
Como herramienta de aprendizaje, incluso para programación, que es un campo del que no conozco demasiado, le veo bastantes riesgos, porque al final aprender vas a aprender, pero en muchos casos no vas a saber el motivo por el que ha tomado una determinada decisión, o qué líneas de código no pintan absolutamente nada para lo que tú quieres. Para un programador con experiencia es una herramienta válida, para uno que está aprendiendo no sé si será más un riesgo que otra cosa, depende de la base que tengas. Si no tienes ninguna base creo que te compensa meterte en foros y ver las discusiones para entender mejor el fondo de la cuestión.
Y respecto a lo otro, para mí no es superior un modelo de buscador cuyo principal riesgo a día de hoy es que invente información. Con Bing ya se ha visto que podía inventarse algo y citar correctamente el enlace en el que aparece recogido el dato correcto. Es más natural, sí, pero es que Google a día de hoy técnicamente no se equivoca, eres tú el que eliges el enlace que quizá no tenga información completamente correcta, y eres tú el que tienes la capacidad para no volver a entrar en dicha web cuando notes que la información que tienen ahí es de mala calidad.
La IA simplifica el proceso de búsqueda, pero también introduce nuevas complicaciones (puede ser que tome por bueno un enlace de mierda, puede ser que invente información, puede ser que no entendiese la pregunta y responda como si lo hubiese hecho, etc). Estamos introduciendo en la búsqueda un nuevo intermediario que está lejos de ser 100% fiable y que en ocasiones no vamos a poder juzgar a menos que ya sepamos algo del tema sobre el que estamos buscando.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a Ladderman

javierverdugo

* *

20 May. 2023, 10:44

26

Como herramienta de aprendizaje, incluso para programación, que es un campo del que no conozco demasiado, le veo bastantes riesgos, porque al final aprender vas a aprender, pero en muchos casos no vas a saber el motivo por el que ha tomado una determinada decisión, o qué líneas de código no pintan absolutamente nada para lo que tú quieres. Para un programador con experiencia es una herramienta válida, para uno que está aprendiendo no sé si será más un riesgo que otra cosa, depende de la base que tengas. Si no tienes ninguna base creo que te compensa meterte en foros y ver las discusiones para entender mejor el fondo de la cuestión.
No estoy de acuerdo en este parrafo.
Le puedes literal, decir que te explique que significa línea a línea, y la explicación es super útil.
Yo he aprendido más de VEX de Houdini con Chatgpt que mirando en foros. Que no digo que no sea valido. Pero es que no hay nivel, es super personalizado.
Donde tu ves riesgos yo veo ventajas. Y por lo eso lo uso y sigo aprendiendo y mejorando.
Obviamente, has de saber algo del tema.
Si yo quiero aprender japonés y le digo que me traduzca sin saber nada, como sé si es cierto o no?
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
Respondiendo a Ladderman

asgaroudf

* *

15 May. 2023, 21:04

25

Que gran respuesta, resumiste muy bien lo que es la IA estos días.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
interesante

javierverdugo

* *

12 May. 2023, 18:59

15

Pero tiene truco.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 4 votos, karma: 53 Vota positivo Vota negativo
1

Comentario moderado
3

Comentario moderado
Usuario desactivado

13 May. 2023, 3:16

18

Seguro que el Word hace un auto resumen mas rápido. No se puede decir que lee porque no comprende, si se refiere a leer sin comprender entonces es como copiar un archivo y eso seria muy lento en comparación.
Menú
red1

* * *

12 May. 2023, 15:18

11

Anthropic deja en ridículo a redactores de XATAKA: su chatbot Claude es capaz de escribir un articulo sin click bait en menos de un minuto
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 2 votos, karma: 20 Vota positivo Vota negativo
daniel3241

* * *

12 May. 2023, 13:08

6

Ojala tenga éxito, seria un grandísimo avance que si lo juntas con chatGPT 4 conseguiríamos unas herramientas potentísimas tanto para el ámbito educativo como para las empresas.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 10 Vota positivo Vota negativo
2

Comentario moderado
Mol O Boo

*

12 May. 2023, 16:11

12

Picapleitos with the ass on fire...
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 0 votos, karma: 8 Vota positivo Vota negativo
13

Comentario moderado
Usuario desactivado

12 May. 2023, 19:02

16

Que paso con las computación cuántica? "la posibilidad de hacer millones de operaciones simultáneas revolucionará la informática" 😃
Menú
Respondiendo a Usuario desactivado

Grammar Police

* * *

13 May. 2023, 7:25

19

Que tiene que ver la computación cuantica con este artículo? La computación cuántica sigue ahí y se han hecho grandes avances.
Menú
- Reportar (spam, insultos...)
- Copiar enlace a este comentario
- 1 voto, karma: 28 Vota positivo Vota negativo