GPT-4.5 es la demostracion de que usar más GPUs y más datos ya no sirve de casi nada

Posted by:

|

On:

|

En los últimos dos años, la estrategia de escalar utilizando más GPUs y datos para mejorar los modelos de inteligencia artificial ha dejado de ser efectiva, según expertos como Gary Marcus. Este cambio de paradigma se refleja en GPT-4.5, el último sucesor de la línea de modelos de ChatGPT. La desaceleración en la mejora de los modelos generativos sin razonamiento ha llevado a un enfoque renovado en modelos de razonamiento como Gemini 2.0 Flash Thinking. La inversión en centros de datos se enfoca ahora en la inferencia y la optimización de los modelos existentes, mientras que la innovación se dirige hacia modelos que razonan.