Estoy contratando a ingenieros de investigación con un enfoque en RL e infraestructura de formación distribuida Estamos escalando RL con un modelo de parámetros 1t Mis mensajes privados están abiertos