Chinesa DeepSeek ultrapassa ChatGPT e faz tremer os mercados (SP500 e NVIDIA)

Chinesa DeepSeek ultrapassa ChatGPT e faz tremer os mercados (SP500 e NVIDIA)
0
0

Quando pensamos em tecnologia, a China está sempre presente na fila da frente em disputas pelas mais avançadas (e baratas) tecnologias de ponta mundiais.

A verdade é que a terra "tremeu" por estes dias, mas neste caso nada teve a ver com intempéries. Se estás familiarizado com o mercado da Inteligência Artificial (IA) já sabes do que falamos, se não, anda connosco que nós explicamos.

A evasão da DeepSeek

A DeepSeek é a empresa responsável pela criação do mais recente (e extraordinário) modelo de IA, o DeepSeek-R1. A empresa, sediada na China, causou por estes dias uma autêntica sangria nas Big Techs mundiais, abalando por completo as ações das gigantes da tecnologia como Nvidia, Microsoft e Meta. Aliás, já há quem chame ao dia de hoje a "Bloody Monday" do mercado da tecnologia, com as ações a cair a pique, como o stock price da Nvidia, que hoje recuaram mais de 11%. A DeepSeek ultrapassou esta Segunda, 27, o ChatGPT, da OpenAI, e tornou-se a aplicação gratuita mais bem avaliada disponível na App Store da Apple nos Estados Unidos.

Mas, afinal, o que é a DeepSeek?

A DeepSeek foi fundada em 2023 por Liang Wenfeng e o seu objectivo é muito claro: desenvolver modelos de IA mais eficientes com o foco na pesquisa fundamental, em vez de perseguirem o lucro imediato, como fazem as outras grandes empresas, que priorizam a comercialização rápida. Apesar de usarem chips com custos modestos, a empresa conseguiu destacar-se no mercado mundial, mesmo depois de sofrer restrições de exportação dos EUA. A dificuldade aguça o engenho e pode dizer-se que estas sanções americanas em solo chinês não jogaram a favor dos "States", já que o impedimento de exportação da Nvidia H100 em solo chinês promoveu a criação deste novo chip H800.

A dimensão dos valores

No mercado financeiro o investimento/lucro é fundamental para a subsistência das empresas, desde as menores até às estratosféricas. Para termos noção da diferença de investimento, a DeepSeek gasta cerca de 6 milhões de dólares para criar o seu chip, enquanto modelos como o Llama 3.1 da Meta custaram mais de 60 milhões para serem desenvolvidos.

O que torna a DeepSeek única?

O que faz da DeepSeek uma empresa única está assente em vários fatores, desde logo o seu relacionamento de custo/eficiência, mas não só. Esta startup permite que os seus modelos aprendam por tentativa e erro e ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando dessa forma os recursos computacionais.

Talvez o que mais diferencie esta empresa das gigantes que conhecemos é que a DeepSeek trabalha no modelo "open-weight". Queremos com isto dizer que a startup adota um modelo parcialmente aberto, que permite que os pesquisadores acessem os seus algoritmos (algo que, se pensarmos bem, seria impossível nas gigantes americanas)

Vê também: Namorada artificial lucra 30 mil dólares com homens carentes

O ensino na vanguarda da tecnologia

Claro que quando falamos de uma ideia tão "moderna" como um novo modelo de IA, temos de pensar que estes são criados por cabeças geniais. No caso da DeepSeek, a startup surgiu pela mão de alunos recém-formados de universidades de elite chinesas, como Tsinghua e Peking. O sucesso astronómico que atingiu este DeepSeek R1 fez tremer as "vacas sagradas" da tecnologia americana, com várias empresas afetadas nos últimos dias.

O futuro da IA

Este é um tema sensível, falar sobre o futuro de algo que está em constante mutação pode ser perigoso, além de especulativo. Certo é que os especialistas acreditam que podemos estar a assistir ao início de uma revolução no mercado, com a China em "guerra aberta" com os EUA. Uma coisa parece evidente: não são necessários tantos recursos para fazer um modelo competitivo.

O momento é tão sensível que já foi apelidado de "momento Sputnik" da inteligência artificial, fazendo referência à corrida espacial entre Rússia e EUA ao lançar o primeiro satélite em órbita. Mudam-se os tempos, continua a corrida à tecnologia de ponta mundial.

Desafios da DeepSeek

Perceção Global: A DeepSeek procura conquistar reconhecimento e confiança além das fronteiras da China. Competir com líderes do mercado como a OpenAI e a Google implica investir em posicionamento internacional e garantir uma imagem sólida e fiável.

Censura: As restrições governamentais aplicadas aos modelos da empresa podem afetar a forma como esta expande a sua presença em diversos mercados. Essas limitações podem dificultar a adoção das soluções DeepSeek a nível global, dependendo do tipo e grau de censura em questão.

Limitações de Hardware: O acesso limitado a chips avançados obriga a DeepSeek a apostar numa inovação constante. Sem recursos de hardware de topo, a empresa tem de encontrar novas formas de superar desvantagens computacionais e manter o desempenho competitivo dos seus modelos.

O que é o Ollama e como utilizar a DeepSeek

O Ollama é uma ferramenta que permite correr modelos de Inteligência Artificial de forma local e direta a partir da linha de comandos (CLI). Foi criada a pensar na conveniência de instalar e testar modelos de linguagem sem depender unicamente da nuvem ou de configurações complexas. Com o Ollama, podes descarregar e gerir vários modelos (como LLaMA, Alpaca, entre outros), usando apenas instruções simples no teu terminal.


  1. Instalar o Ollama

    • Acede ao repositório oficial do Ollama ou ao site do projeto.

    • Segue as instruções de instalação para o teu sistema operativo (macOS, Linux ou outro, consoante o suporte disponível).



  2. Verificar Modelos Compatíveis

    • Confirma se o Ollama suporta diretamente o modelo da DeepSeek que pretendes usar (por exemplo, DeepSeek-R1). É possível que encontres referências ou ficheiros de modelo preparados para serem executados localmente.



  3. Descarregar o Modelo DeepSeek

    • Caso exista uma versão preparada para uso em Ollama, faz o download do ficheiro de modelo (habitualmente em formato binário ou outro compatível).

    • Copia o ficheiro para o diretório de modelos usado pelo Ollama ou segue as instruções específicas para adicionar um novo modelo.



  4. Configurar o Ollama para Reconhecer o Modelo

    • A partir da linha de comandos, navega até à pasta onde colocaste o modelo.

    • Usa a sintaxe do Ollama para registar o novo modelo.
      Por exemplo:

      bash






      ollama add-model --name deepseek-r1 --file /caminho/para/deepseek-r1.bin


    • Substitui os nomes e caminhos conforme necessário.



  5. Executar Pedidos (Prompts) com a DeepSeek

    • Depois de adicionares o modelo, podes chamar o Ollama para gerar texto ou responder a perguntas:

      bash
      ollama run deepseek-r1 --prompt "Explica o conceito de Reinforcement Learning"
    • Ajusta as definições de inferência (número de tokens, temperatura, etc.) de acordo com as capacidades oferecidas pelo Ollama e pelo modelo da DeepSeek.
  6. Explorar Funções Avançadas
    • A DeepSeek pode incluir funcionalidades como Reinforcement Learning, Mixture-of-Experts ou Multi-Head Latent Attention. Se o modelo suportar opções de configuração específicas, verifica a documentação para personalizares a experiência de acordo com o teu caso de uso.
  7. Manter o Ambiente Atualizado
    • Verifica se há atualizações para o Ollama que possam melhorar o desempenho ou a compatibilidade com a DeepSeek.
    • Acompanha também as novidades da DeepSeek, pois o modelo pode receber melhorias ou oferecer versões mais otimizadas para ambiente local.

DeepSeek deixa de receber novos utilizadores (fora da China)

Novos utilizadores estão a ser impedidos de se registar na App após uma limitação que não permite números fora da China possam completar a inscrição.

0 comentários

Entra para comentar.

Ainda não há comentários. Sê o primeiro.