VisualGPT da Microsoft lança uma nova tecnologia “ VisualGPT ”Isso é um avanço da IA e abre possibilidades para experiências de IA mais atraentes e interativas, preenchendo a lacuna entre o visual e a linguagem.
O que é VisualGPT?
VisualGPT é uma versão estendida do ChatGPT que é baseada em modelos de PNL (Natural Language Processing), mas no VisualGPT é usado o VFMS, que pode converter consultas de texto em formato de imagem. É tal que é uma combinação/integração de consultas de texto e imagem.
Objetivo do VisualGPT
Após o lançamento do ChatGPT no mercado que trabalhava apenas no formato textual, para atingir o próximo nível de avanço existe a ferramenta perfeita que funcionará do formato textual para gráfico, seguindo todos esses motivos e na corrida pela IA avanço Microsoft lança VisualGPT o objetivo principal do VisualGPT é criar imagens de IA sob demanda do usuário ou analisar a imagem
Arquitetura do VisualGPT
VisualGPT contém a consulta do usuário, o gerenciador de prompts, os modelos de base visual (VFMs), o princípio do sistema, o histórico do diálogo, o histórico do raciocínio e a resposta intermediária.
Se falarmos especificamente sobre seu modelo, ou seja, “ VFMs (modelos de base visual) ”, quase 22 VFMs são usados, como BLIP (Bootstrapping Language-Image Pre-training) e Stable Diffusion.
Como executar um ChatGPT visual?
Para executar um Visual ChatGPT, considere as seguintes etapas:
Etapa 1: crie um ambiente
Primeiramente, você precisa criar um ambiente do Python versão 3.8:
sistema de importação
sys.path.append ( '/usr/local/lib/python3.8/site-packages' )
Etapa 2: clonar arquivo Visual ChatGPT
Agora, clone o arquivo visual ChatGPT do GitHub usando o seguinte comando:
! clone https: // github.com / deepanshu88 / visual-chatgpt.git
Etapa 3: configurar um novo diretório
Depois disso, configure um novo diretório por meio do comando abaixo:
% cd visual-chatgptEtapa 4: instale os pacotes necessários
Agora, instale os pacotes necessários usando o “ pip ” cmdlet:
! enrolar https: // bootstrap.pypa.io / get-pip.py -o get-pip.py! python3.8 get-pip.py
! python3.8 -m pip instalar -r requisitos.txt
Etapa 5: acesse a API OpenAI
Após instalar os pacotes iniciais, acesse a API OpenAI obtendo uma chave de API em “platform.openai.com” e fazendo chamadas de API autenticadas:
% ambiente OPENAI_API_KEY =sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxPasso 6: Escolha o modelo
Por último, após acessar o Openai escolha o Modelo, são mais de 20 modelos que são utilizados no visualGPT que você pode escolher conforme sua necessidade:
! python3.8. / visual_chatgpt.py --carregar Text2Image_cuda: 0No comando acima, “ Texto2Imagem ”corresponde ao modelo a ser utilizado. Para mais detalhes, verifique este Google Colab caderno .
Conclusão
O ChatGPT foi introduzido para obter respostas específicas sobre qualquer consulta e agora a Microsoft lançou o VisualGPT, que é capaz de lidar com dados textuais e também pictóricos. É tal que o usuário pode simplesmente adicionar seus requisitos em forma de texto e obter sua saída gráfica.