O objetivo dessa iniciativa experimental é incetivar pessoas a estudarem novos idiomas (os suportados pela IA do Google nessa ocasião), utilizando conhecimentos sobre LLMs, a API do Gemini e engenharia de prompt para construir-lo. Onde ao colocar entradas de imagem, vídeo e audio e depois os de texto, o Gemini em sua versão 1.0 Pro entregará como saída uma explicação satisfatória sob a entrada coloca pelo usuário. Dando tanto explicações de gramática e léxica, como também aspectos socioculturais e as referências com os dados encontrados.
- 👌Inserção de caminhos de diretório de imagens, vídeos e áudios.
- 👌Inserção de entradas de texto em todos os idiomas suportados pelo Gemini, via API do Google AI Studio.
- 👌Uso do método de chatbot para usar múltiplas vezes o programa, cumprindo o objetivo designado.
- 👌Visualização melhorada para uma navegação mais confortável.
- A resposta dada do modelo colorida em azul, para diferenciar da resposta do usuário.
- Interface de usuário com Tecnologias Web.
Vimos que com o aprendizado das técnicas de engenharia de Prompt, conhecimento sobre as LLMs, uso do Python para manipular a API do Gemini, temos a nossa disposição uma gama bem considerável de possibilidades em diversas áreas de aplicação no mercado. E tendo como chamariz do Gemini, a multimodalidade com a possibilidade de misturar 4 formatos distintos de entrada, texto, áudio, vídeo e imagem. Todo o processo se torna mais surpreendente quando o testamos com todo o nosso ferramental disponível.