Pesquisadores da Universidade de Stanford, nos Estados Unidos, conseguiram clonar o ChatGPT por um custo de apenas US$ 600 (pouco mais de R$ 3 mil na conversão atual). Chamado Alpaca GPT, a tecnologia prova que softwares como os criados pela OpenAI podem ser mais simples de replicar do que se imagina.
Os estudiosos pertencem ao Centro de Pesquisa em Modelos de Fundação de Stanford. Como trabalho acadêmico, resolveram criar um modelo de linguagem próprio a partir da tecnologia da Meta — LLaMA 7B — e integrado com a API GPT da OpenAI.
I don’t know what to make about this development. Alpaca is surprisingly very good. The claim here is the training can be done in 5 hours on a single RTX 4090. Have GPT-like models been democratized overnight?! https://t.co/ysfn5u6xwI
–
Feedly: assine nosso feed RSS e não perca nenhum conteúdo do Canaltech em seu agregador de notícias favorito.
–— Carlos E. Perez (@IntuitMachine) March 16, 2023
Como eles não precisaram criar o algoritmo do zero nem investir em máquinas potentes para desenvolver a tecnologia, o custo total foi apenas pago às empresas para fins de licenciamento. Foram US$ 500 para a OpenAI e apenas US$ 100 para a Meta, o que permitiu o uso para a criação do projeto atual.
A quantia é irrisória se comparada aos milhões, talvez bilhões, investidos pelas duas Big Techs na criação de suas ferramentas de IA. A Alpaca GPT exibe comportamento muito semelhante ao GPT-3.5, usado para alimentar a versão inicial do ChatGPT.
Alpaca GPT surpreendeu pela capacidade
Os pesquisadores de Stanford disseram ter ficado muito surpresos quando compararam a Alpaca com outros modelos do mercado. Em alguns casos, disseram que a tecnologia chegou a ser superior, com resultados mais diretos e precisos que o próprio ChatGPT.
Mesmo com o avanço, a IA de Stanford ainda sofre de várias deficiências comuns aos modelos de linguagem, como “alucinação, toxidade e estereótipos”. Esses são problemas que o GPT-4 e sucessores buscam combater, afinal ninguém quer conversar com uma inteligência que começa a “surtar” do nada, dando respostas ríspidas, incoerentes ou totalmente descontextualizadas.
Para chegar ao resultado, a equipe pediu ao GPT que pegasse 175 pares de instruções escritas por humanos e começasse a gerar mais no mesmo estilo e formato, sempre com a apresentação de 20 de cada vez. Esse processo foi automatizado por uma das APIs da OpenAI, o que gerou, em pouco tempo, mais de 52 mil conversas.
Essas interações viraram uma amostra considerável usada no treinamento do modelo LLaMA. O resultado foi a otimização da base de dados da Meta com a capacidade de processamento da solução da OpenAI, criando um terceiro produto (Alpaca) por menos R$ 3,1 mil e mais capacidade que os dois produtos.
IAs em alta e mercado movimentado
As últimas semanas foram movimentadas no terreno das inteligências artificiais. Após a OpenAI lançar sua API para o mercado, a Meta teve a LLaMA vazada na Web e a Microsoft decidiu acabar com a fila de espera para uso do Bing Chat.
Logo em seguida, foi lançado o GPT-4 e o Ernie Bot, da chinesa Baidu, que decepcionou pela simplicidade. Na semana passada, o gerador de imagem a partir de texto Midjourney também ganhou uma versão otimizada para criar fotos e artes ainda melhores.
Fato é que enquanto empresas como Microsoft, OpenAI e Meta torram milhões de dólares para desenvolver modelos de IA, cientistas conseguem criar soluções muito mais baratas. Será que a “pirataria tecnológica” poderia ser uma ameaça ao desenvolvimento das IAs generativas? Esta pode ser uma boa discussão para o futuro.
Trending no Canaltech:
- O que significa marmita de casal?
- Kang diz qual dos Vingadores é o herói que mais teme na Marvel
- Movimento de icebergs gigantes pode afetar vida marinha e rotas de navios
- Março lilás: vacina do HPV reduz até 90% dos casos de câncer de colo de útero
- Quando John Wick 4: Baba Yaga estreia no Brasil?
- Cientistas criam “salada de outro mundo” para a dieta dos astronautas
Fonte: Canaltech