Fundo quantitativo de IA High-Flyer está por trás do chinês DeepSeek

29/01/2025 - 14:48

Para compartilhar:

O fundo de hedge quantitativo High-Flyer construiu um portfólio de 100 bilhões de yuans (US$ 13,79 bilhões) usando modelos de inteligência artificial para tomar decisões de investimento, mas em 2023 decidiu mudar de rumo para se concentrar no desenvolvimento da IA mais avançada.

+Dona do ChatGPT suspeita que DeepSeek tenha ‘roubado dados’ e violado direitos autorais

Em uma publicação em sua conta oficial do WeChat, a Hangzhou Huanfang Technology Ltd Co. — como a empresa é oficialmente chamada — disse que se concentraria na busca pela inteligência artificial geral (AGI, na sigla em inglês).

“A High-Flyer concentrará seus recursos e força, se dedicará totalmente a servir a tecnologia de IA que beneficia toda a humanidade, criará um novo grupo de pesquisa independente e explorará a essência da AGI”, disse a empresa.

A OpenAI, apoiada pela Microsoft, que desenvolveu o ChatGPT, define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

É a próxima geração de modelos de IA e, em uma postagem no X na semana passada, o CEO da OpenAI, Sam Altman, disse que sua empresa ainda não havia atingido esse marco.

O grupo de pesquisa independente previsto pela High-Flyer foi o DeepSeek, cujos modelos abalaram o setor de tecnologia global nas últimas semanas. O fundador e acionista controlador da High-Flyer, Liang Wenfeng, também é o líder discreto da DeepSeek.

Liang Wengfeng, fundador da start-up chinesa DeepSeek (Crédito:Reprodução/YouTube/Reuters)

A sofisticação dos modelos da DeepSeek foi amplamente elogiada por seus concorrentes do Vale do Silício, uma novidade para um modelo de IA chinês, mas as alegações da startup de que usou uma fração do poder de computação implantado pelas principais empresas dos EUA para seus próprios modelos desencadearam uma liquidação de ações de tecnologia em todo o mundo.

Não está claro o quão perto o DeepSeek está de desenvolver um modelo AGI.

Embora o sucesso do DeepSeek pareça ter acontecido quase da noite para o dia, o High-Flyer mostra como essa ascensão meteórica levou mais de uma década para acontecer.

Sob a liderança de Liang, o fundo passou anos estudando e experimentando modelos de IA no exterior, aplicando essa tecnologia aos seus negócios e investindo dezenas de milhões de dólares em chips Nvidia de ponta, para fornecer o poder de computação necessário para dar suporte a essa estratégia centrada em IA, de acordo com uma análise da Reuters dos sites da High-Flyer e das contas oficiais do WeChat.

Clusters de supercomputação

A estratégia inclui a construção de dois clusters de supercomputação de IA, compostos inteiramente pelos poderosos chips A100 da Nvidia, cuja exportação para a China foi proibida por Washington em setembro de 2022.

Os clusters A100 da High-Flyer foram construídos e colocados em operação muito antes dos controles de exportação serem anunciados. O primeiro cluster, composto por 1.100 chips A100, custou 200 milhões de yuans e foi colocado em operação em 2020, enquanto o segundo, composto por cerca de 10.000 chips A100, foi concluído um ano depois com um custo de 1 bilhão de yuans, de acordo com o site da empresa e várias postagens no WeChat.

Em 2022, pesquisadores da High-Flyer AI apresentaram uma estratégia em uma conferência da Nvidia que a empresa desenvolveu para maximizar a eficiência do segundo cluster ao treinar modelos de IA.

Não está claro quanto a High-Flyer investiu na DeepSeek. A High-Flyer tem um escritório localizado no mesmo prédio da DeepSeek e possui patentes relacionadas a clusters de chips usados para treinar modelos de IA.

Liang tem uma participação de 55% na High-Flyer, de capital fechado, e detém 99% dos direitos de voto, de acordo com registros corporativos chineses. As ações restantes são detidas por outros executivos do fundo.

Até agora, a DeepSeek só afirmou usar os chips H800 e H20, muito menos potentes, da Nvidia para treinar seu modelo DeepSeek-V3 e seu antecessor DeepSeek-V2, o que desencadeou uma guerra de preços de modelos de IA na China quando foi lançado em maio passado.

No entanto, alguns executivos de tecnologia afirmaram publicamente que o DeepSeek tem muito mais poder computacional à sua disposição.

O CEO da Scale AI, Alexandr Wang, disse durante uma entrevista à CNBC na quinta-feira, sem evidências, que a DeepSeek tem 50.000 chips Nvidia H100, que ele alegou não terem sido divulgados porque violaria os controles de exportação de Washington. Os Estados Unidos proibiram a exportação de chips H100 para a China ao mesmo tempo em que vetaram o A100, menos potente.

A DeepSeek não respondeu a um pedido de comentário sobre a alegação. A Nvidia também não respondeu imediatamente a um e-mail pedindo comentário.

Mas a preocupação de Liang com o poder de computação, ao discutir o futuro da DeepSeek, ecoa o investimento massivo de seu fundo quantitativo em clusters de IA. Questionado em uma entrevista ao chinês Waves em julho passado se a High-Flyer planejava separar a DeepSeek da empresa e torná-la pública, Liang respondeu:

“Não temos planos de levantar dinheiro no curto prazo. O problema que enfrentamos nunca foi dinheiro, mas o embargo aos chips de ponta.”

Para compartilhar:

Clusters de supercomputação

Compartilhe: