MiniMax lancia M2.7, un modello AI progettato per agenti che usa se stesso per ottimizzare autonomamente i processi di reinforcement learning. Il modello evolve in produzione in cicli di 24 ore, coprendo il 30-50% del workflow tipico di ricerca RL senza intervento umano — un salto oltre la staticità tradizionale dei modelli.