A parceria OpenAI Scale AI chegou ao fim, e isso pode mudar o cenário da rotulagem de dados na indústria de IA.
Com a recente separação, o setor enfrenta novos desafios e oportunidades, enquanto empresas como Meta investem pesado em infraestrutura de dados.
O impacto da separação entre OpenAI e Scale AI
A separação entre OpenAI e Scale AI marca um momento significativo na indústria de inteligência artificial, especialmente considerando que a Scale era responsável por tarefas complexas de rotulagem de dados para modelos avançados como o GPT-4.
Essa ruptura, confirmada por um porta-voz da OpenAI, ocorre após o investimento de $14,3 bilhões da Meta por uma participação de 49% na Scale. Esse movimento é visto como uma reconfiguração das linhas de batalha na corrida pela inteligência artificial, com a Meta buscando fortalecer sua posição no mercado.
Alexandr Wang, fundador da Scale, agora lidera a divisão de IA da Meta, o que, segundo Deepika Giri, da IDC Asia/Pacific, representa um desafio profundo à neutralidade de dados nas camadas fundamentais da IA. Giri alerta que o mundo está se movendo em direção a ecossistemas neutros em termos de fornecedores, onde a segurança dos dados e plataformas abertas são essenciais. No entanto, com os grandes provedores dominando os pipelines centrais, essa neutralidade enfrenta pressão sem precedentes.
As altas apostas nas guerras de dados e talentos da IA
A avaliação de $29 bilhões da Scale pela Meta destaca a guerra em duas frentes por infraestrutura de dados e talentos de elite. A Meta não está apenas investindo em tecnologia, mas também oferecendo pacotes financeiros sem precedentes para atrair funcionários de alto nível, incluindo ofertas de $100 milhões para ex-colaboradores da OpenAI. Apesar disso, muitos ainda optam por permanecer na OpenAI ou na Anthropic.
A saída da OpenAI e o investimento da Meta têm o potencial de desestabilizar a indústria de rotulagem de dados, que deve alcançar $29,2 bilhões até 2032. Jason Droege, CEO interino da Scale, reafirmou em um post que a governança de dados da empresa permanece independente, garantindo que “nada mudou em nosso compromisso de proteger os dados dos clientes”.
No entanto, essas garantias podem não ser suficientes. A OpenAI já havia reduzido silenciosamente o uso dos serviços da Scale, buscando dados mais especializados.
A saída da OpenAI redesenha o cenário de dados da IA
A Scale, que começou como uma pioneira em rotulagem de dados com uma base global de contratados, reportou $870 milhões em receita para 2024. Contudo, com grandes clientes como o Google, que gastou $150 milhões no ano passado, seu futuro é incerto.
O CEO da Handshake, um concorrente da Scale, afirmou que a demanda pelos serviços de sua empresa “triplicou da noite para o dia” após o acordo com a Meta. Essa mudança reflete o medo entre os rivais da Meta de que dados proprietários e roteiros de pesquisa possam vazar para um concorrente através dos serviços da Scale.
Essa reconfiguração também expôs falhas nos contratos de IA corporativa, que muitas vezes carecem de cláusulas robustas de “mudança de controle” ou salvaguardas contra conflitos de fornecedores, deixando as empresas vulneráveis quando parceiros se alinham com rivais. Ipsita Chakrabarty, analista do QKS Group, observou que muitos contratos ainda dependem de métricas de precisão estáticas que falham diante da deriva de dados do mundo real.
Apesar disso, o valor da Scale reside em sua rede de treinadores de elite, que lidam com tarefas especializadas a custos que variam de “dezenas a centenas de dólares” por unidade. Embora a participação não votante da Meta tenha evitado uma revisão antitruste automática, os reguladores podem ainda investigar a linha tênue entre influência e controle. As implicações completas dessa separação levarão meses para se desenrolar, à medida que revisões regulatórias, transições de fornecedores e auditorias internas continuem a remodelar a cadeia de suprimentos de dados da IA.
As novas realidades do desenvolvimento de IA
À medida que empresas como o Google correm para construir capacidades internas de rotulagem de dados, a indústria enfrenta a escolha de repetir os erros da era de consolidação da nuvem de 2010-2015 ou optar por um caminho mais aberto.
“Estamos vendo a história se repetir”, observou Anushree Verma, diretora sênior da Gartner. “A corrida pela IA está causando fragmentação entre fornecedores agora, mas a consolidação é inevitável.” As semelhanças são marcantes. Assim como os provedores de nuvem antes deles, os gigantes da IA estão pressionando por integração vertical, o que pode aprisionar as empresas em sistemas monolíticos. Ela aconselhou os CIOs a priorizar “soluções ágeis e interoperáveis” como salvaguardas contra sistemas monolíticos.
Isso ressoa com a sugestão da IDC para “ecossistemas neutros em termos de fornecedores, onde a segurança dos dados, conformidade regulatória e plataformas abertas ocupam o centro do palco”, uma filosofia que agora colide com a realidade dos jardins murados da indústria.
Para os CIOs, esse momento exige mais do que listas de verificação de compras. A adoção bem-sucedida da IA requer a incorporação de “gestão de mudanças, rastreabilidade de decisões e design de interação humano-IA” desde o primeiro dia, segundo Chakrabarty do QKS.
O desafio agora vai além da conformidade. É necessário testar os ecossistemas de IA com a mesma urgência aplicada a vulnerabilidades de nuvem e chip. “A melhor abordagem”, de acordo com Giri da IDC, “é avaliar as capacidades de forma independente e evitar a integração profunda em toda a pilha, pois um sistema monolítico pode carecer da flexibilidade necessária para acompanhar as necessidades de amanhã.”
Desafios e oportunidades na rotulagem de dados
Os desafios e oportunidades na rotulagem de dados estão se intensificando com a recente separação entre OpenAI e Scale AI, uma parceria que era fundamental para a rotulagem de dados em modelos avançados como o GPT-4. Essa mudança não apenas altera o cenário competitivo, mas também levanta questões sobre a neutralidade dos dados e a segurança das informações.
A saída da OpenAI da Scale, confirmada por um porta-voz da OpenAI, ocorre em um momento em que a Meta investiu US$ 14,3 bilhões para adquirir 49% da Scale, o que pode redefinir as linhas de batalha na corrida pela inteligência artificial. A Meta está agora em uma guerra de dois frentes, buscando tanto infraestrutura de dados quanto talentos de elite, oferecendo pacotes financeiros impressionantes para atrair funcionários da OpenAI.
Por exemplo, a Meta está oferecendo salários que variam de sete a nove dígitos, o que pode ser um atrativo irresistível para muitos profissionais. No entanto, nem todos estão sendo seduzidos por essas ofertas, e muitos ainda preferem permanecer na OpenAI ou na Anthropic.
Além disso, a saída da OpenAI e o investimento da Meta estão prestes a causar uma disrupção significativa na indústria de rotulagem de dados, que está projetada para alcançar US$ 29,2 bilhões até 2032. A Scale, que reportou uma receita de US$ 870 milhões para 2024, enfrenta incertezas sobre seu futuro, especialmente com grandes clientes como o Google, que gastou US$ 150 milhões no ano passado.
O CEO de uma empresa concorrente da Scale mencionou que a demanda por seus serviços triplicou da noite para o dia após o acordo da Meta, refletindo o medo de que dados proprietários e roteiros de pesquisa possam vazar para concorrentes através dos serviços da Scale.
Outro desafio significativo é a falta de cláusulas robustas de “mudança de controle” nos contratos de IA, que deixam as empresas vulneráveis quando seus parceiros se alinham com rivais. Isso pode resultar em empresas que terceirizam inteligência, mas mantêm a responsabilidade por falhas.
Por outro lado, a Scale ainda possui um valor considerável em sua rede de treinadores de elite, que lidam com tarefas especializadas a um custo que varia de “dezenas a centenas de dólares” por unidade. A situação atual exige que as empresas considerem soluções ágeis e interoperáveis para evitar a armadilha de sistemas monolíticos.
Assim, a realidade da rotulagem de dados está mudando rapidamente, e as empresas precisam se adaptar a essas novas dinâmicas para garantir a segurança e a eficácia de suas operações de IA.
Fonte: Computer World
As novas realidades do desenvolvimento de IA
Com a crescente pressão para que empresas como o Google desenvolvam suas próprias capacidades de rotulagem de dados, o setor se vê diante de uma escolha crucial: repetir os erros da era de consolidação da nuvem de 2010-2015 ou optar por um caminho mais aberto.
Anushree Verma, diretora sênior da Gartner, observa que “estamos vendo a história se repetir”. A corrida pela IA está causando uma fragmentação entre fornecedores, mas a consolidação é inevitável. As semelhanças com os provedores de nuvem são notáveis, pois os gigantes da IA estão promovendo uma integração vertical que pode aprisionar as empresas em sistemas monolíticos.
Verma recomenda que os CIOs priorizem soluções “ágil e interoperáveis” como salvaguardas contra esses sistemas monolíticos. Essa abordagem é reforçada pela sugestão da IDC de criar “ecossistemas neutros em relação a fornecedores, onde a segurança dos dados, a conformidade regulatória e as plataformas abertas ocupem o centro do palco”. No entanto, essa filosofia está em conflito com a realidade dos jardins murados da indústria.
Para os CIOs, este momento exige mais do que listas de verificação de compras. A adoção bem-sucedida da IA requer a incorporação de “gestão de mudanças, rastreabilidade de decisões e design de interação humano-IA” desde o primeiro dia, segundo Ipsita Chakrabarty, da QKS Group.
O desafio agora vai além da conformidade. É necessário testar os ecossistemas de IA com a mesma urgência aplicada às vulnerabilidades de nuvem e chip. “A melhor abordagem”, de acordo com Deepika Giri, da IDC, “é avaliar as capacidades de forma independente e evitar a integração profunda em toda a pilha, pois um sistema monolítico pode carecer da flexibilidade necessária para atender às necessidades futuras.”
Fonte: Computer World