De olho no mercado de Inteligência Artificial, o Google anunciou nesta quarta-feira, 6, o lançamento do Gemini, modelo que dará retaguarda ao Bard, sistema da bigtech que concorre com o Chat GPT. A novidade, por enquanto, está disponível somente em inglês.

“Durante muito tempo, planejamos construir uma nova geração de modelos de IA, inspirados na forma como as pessoas compreendem o mundo e interagem com ele. Uma IA que pareça menos um software inteligente e mais um colaborador ou assistente especializado, ainda mais útil e intuitivo”, afirmou Demis Hassabis, do time que desenvolveu o Gemini. 

+Taylor Swift é a Pessoa do Ano de 2023 da revista “Time”

O que é o Bard? 

O Bard é um sistema de Inteligência Artificial generativa que conversa com o internauta por meio de texto. O processo de machine learning (aprendizado da máquina) faz com que ele melhore as respostas baseado nas próprias interações com os usuários ou com informações disponíveis na internet. 

Como vai funcionar o Gemini? 

O Gemini é uma espécie de motor que vai funcionar dando suporte ao Bard. A companhia informou que ele também poderá ser utilizado em outros sistemas e contará com três versões: Ultra, Pro e Nano o que disponibilizará que ele seja utilizado desde grandes data centers até dispositivos móveis. A versão estará disponível em inglês em mais de 170 países e territórios

A companhia afirmou que o Gemini Ultra foi o primeiro modelo a superar os especialistas humanos em MMLU (Entendimento de Linguagem Massiva e Multitarefa), que usa uma combinação de 57 disciplinas, como matemática, física, história, direito, medicina e ética, para testar tanto o conhecimento sobre o mundo, quanto a capacidade de resolução de problemas. O sistema superou o GPT4. 

Nova tecnologia será multimodal

Um dos problemas que o Google afirma ter superado com o Gemini é que a tecnologia é multimodal. Ao contrário do que existe hoje no mercado, com tecnologias sendo boas, por exemplo, em descrição de imagens, mas deixava a desejar em processos mais complexos. 

“Isso ajuda o Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o início, de uma forma muito melhor do que os modelos multimodais existentes e com recursos de última geração em quase todos os domínios”, explicou a companhia.