Estou contratando engenheiros de pesquisa com foco em RL e infraestrutura de treinamento distribuída Estamos escalando RL com um modelo de parâmetros 1t Meus mestres estão abertos