Comparativa de IA: GPT 5 vs Gemini vs Grok🔥

Breve Resumen

El video explora si ChatGPT 5 ha mejorado en el área de la lógica, enfrentándolo a problemas clásicos de pensamiento lateral. Se compara su desempeño con Gemini 2.5 Pro y Grok 4 para evaluar su capacidad de razonamiento y creatividad al resolver acertijos con variaciones en el contexto. ChatGPT 5 demuestra una mejora notable en la lógica y el razonamiento en comparación con modelos anteriores y sus competidores.

ChatGPT 5 muestra mejoras en lógica y razonamiento.
Se compara con Gemini 2.5 Pro y Grok 4.
ChatGPT 5 supera a sus competidores en la resolución de acertijos complejos.

¿ChatGPT 5 piensa de verdad? Objetivo del reto [0:00]

El objetivo del video es evaluar si ChatGPT 5 ha mejorado en el área de la lógica, especialmente tras la controversia sobre la inclusión del modelo razonador en su base. Para ello, se enfrenta a ChatGPT 5 a problemas clásicos de pensamiento lateral para observar su desempeño. El primer acertijo plantea la situación de un hombre que vive en el décimo piso y solo sube hasta el séptimo en ascensor, para luego subir el resto por las escaleras, buscando determinar si ChatGPT 5 puede resolverlo lógicamente.

Prueba 1: problema original [0:36]

Se introduce el acertijo a ChatGPT 5: un hombre vive en el décimo piso y cada día baja en ascensor hasta la planta baja, pero al volver solo sube hasta el séptimo piso y luego usa las escaleras. ChatGPT 5 responde utilizando su modelo razonador, concluyendo que el hombre es de baja estatura y no alcanza el botón del décimo piso, solo el del séptimo. Esta respuesta correcta demuestra que ChatGPT 5 puede solucionar este tipo de problemas clásicos.

Prueba 2: sube la dificultad [1:03]

Para evitar que ChatGPT 5 simplemente responda de memoria, se modifica el contexto del problema original. Ahora, el hombre vive en el séptimo piso y sube hasta el séptimo piso. Al eliminar la referencia a las escaleras, se busca determinar si ChatGPT 5 razona o simplemente memoriza respuestas. ChatGPT 5 responde correctamente que "no hay truco" porque el hombre vive en el séptimo piso, demostrando que puede adaptarse a los cambios en el contexto y razonar lógicamente.

Prueba 3: pensamiento lateral en acción [2:07]

Se vuelve al problema original, pero se añade la información de que el hombre es suficientemente alto para alcanzar todos los botones del ascensor. ChatGPT 5 responde que el botón del décimo piso está averiado, por lo que solo puede pulsar hasta el séptimo y subir los tres pisos restantes por las escaleras. Esta respuesta demuestra que ChatGPT 5 utiliza la lógica y no se basa únicamente en la memoria, superando la prueba.

Prueba 4: el desafío definitivo [2:47]

Se presenta un escenario más absurdo: un hombre vive en el décimo piso, sube en el ascensor hasta el séptimo, luego sube tres pisos más y después baja dos. Se busca evaluar la creatividad y capacidad de razonamiento de ChatGPT 5 ante una situación ilógica. ChatGPT 5 sugiere que el hombre está haciendo series de entrenamiento de intervalos entre el séptimo y el décimo piso. Al pedir otra solución, ChatGPT 5 propone que podría estar probando el ascensor tras una reparación, repartiendo paquetes o yendo a una visita médica, demostrando una notable capacidad para generar explicaciones creativas y lógicas.

Cara a cara: GPT-5 vs Gemini 2.5 Pro [4:18]

Se compara el desempeño de ChatGPT 5 con Gemini 2.5 Pro, el modelo de Google, utilizando el mismo problema absurdo. Gemini 2.5 Pro responde que el hombre es de baja estatura y no alcanza el botón del décimo piso, ignorando el detalle de que luego baja dos pisos. Esta respuesta sugiere que Gemini 2.5 Pro no busca una solución creativa y se centra en la respuesta clásica del acertijo original, indicando que ChatGPT 5 razona mejor en este caso.

Batalla final: GPT-5 vs Grok 4 [5:36]

Se compara ChatGPT 5 con Grok 4, que se supone que es aún más potente según los tests de IA. Se utiliza el mismo problema absurdo. Grok 4 busca en internet acertijos similares en lugar de razonar por sí mismo, y concluye que el hombre es de baja estatura y no alcanza el botón. Grok 4 no logra ofrecer una solución creativa y se queda en la respuesta del acertijo original, lo que indica que ChatGPT 5 tiene un mejor razonamiento en este caso.

Conclusiones y ganador indiscutible [7:36]

ChatGPT 5 ha mejorado significativamente en el área de la lógica, especialmente en comparación con modelos anteriores. Es capaz de resolver problemas complejos y adaptarse a cambios en el contexto, superando a sus competidores como Gemini 2.5 Pro y Grok 4 en la capacidad de razonamiento y creatividad. Se invita a los espectadores a suscribirse al canal para recibir más tutoriales de inteligencia artificial y a visitar la página web para acceder a cursos gratuitos.