Mecanismos de Extensão para LLMs: MCPs, Skills, Rules e Sub-agents

A capacidade dos Modelos de Linguagem de Grande Escala (LLMs) de interagir com sistemas externos e seguir instruções complexas é fundamental para sua aplicação em ambientes de desenvolvimento de software. Para gerenciar essas interações, foram desenvolvidos diferentes mecanismos, como o Model Context Protocol (MCP), Skills, Rules e Sub-agents, cada um com características e finalidades específicas para otimizar o desempenho e a eficiência dos assistentes de inteligência artificial.

O Protocolo de Contexto de Modelo (MCP)

O Model Context Protocol, ou MCP, é um protocolo que viabiliza a comunicação entre um LLM e ferramentas externas. Proposto pela Anthropic, ele permite que o modelo acesse e utilize APIs de outros serviços. Na prática, um MCP expõe um conjunto de ferramentas disponíveis, e o LLM pode ser instruído a interagir com elas para executar tarefas como obter uma lista de dados de um serviço ou salvar um registro em um sistema externo.

Embora tenha expandido significativamente as capacidades dos LLMs, o MCP introduziu um desafio relacionado à janela de contexto. Cada ferramenta exposta pelo protocolo precisa de uma descrição para que o modelo entenda sua função. Quando um grande número de ferramentas é disponibilizado, a soma de suas descrições consome um espaço considerável no contexto, limitando a capacidade do modelo de processar outras informações, como código ou instruções do usuário. Uma otimização posterior permitiu que o LLM solicitasse a lista de ferramentas e carregasse apenas as instruções daquela que considerasse mais adequada para a tarefa, aliviando parcialmente o problema.

A Eficiência das Skills

As Skills, ou habilidades, surgiram como uma solução mais eficiente para orientar o comportamento de um agente de IA sem sobrecarregar o contexto. Uma skill é, essencialmente, um conjunto de instruções que define como o LLM deve se comportar ou executar uma determinada tarefa. Diferente das ferramentas de um MCP, as skills não se comunicam diretamente com serviços externos, mas podem instruir o modelo a utilizar um MCP configurado para tal fim.

O principal diferencial das skills está em seu mecanismo de carregamento sob demanda. Apenas o nome e a descrição de cada skill são mantidos no contexto inicial. Quando o usuário faz uma solicitação, o LLM analisa essa lista e, se identificar uma skill relevante, carrega seu conteúdo completo para o contexto. Isso garante que apenas as instruções pertinentes à tarefa atual sejam processadas, preservando a janela de contexto para outras informações. Uma skill é tipicamente estruturada com um cabeçalho contendo seu nome e descrição, seguido por um corpo com diretrizes sobre o que fazer e o que não fazer.

A Função das Rules

As Rules, ou regras, são diretrizes específicas de um projeto, funcionando como um conjunto de boas práticas ou restrições que o LLM deve seguir. Elas são frequentemente usadas para definir padrões de codificação, arquitetura de software ou outras convenções particulares de um ambiente de desenvolvimento. Por exemplo, uma regra pode instruir o agente a atuar como um engenheiro de software sênior focado em código de fácil manutenção e alta escalabilidade.

Contudo, as regras apresentam uma desvantagem em comparação com as skills. Elas são carregadas como um prompt de sistema fixo a cada nova sessão de chat. Isso significa que todo o seu conteúdo ocupa permanentemente a janela de contexto, independentemente de serem relevantes para a tarefa em execução. Com a popularização das skills, que são mais universais e eficientes em termos de uso de contexto, as regras se tornaram uma abordagem menos utilizada.

A Especialização com Sub-agents

Os Sub-agents representam um nível adicional de especialização. São agentes de IA com personalidades e funções bem definidas, projetados para executar tarefas específicas. Um sub-agent pode ser, por exemplo, um especialista em 'clean code', um revisor de código ou um assistente de busca. Essa abordagem permite delegar atividades a um agente focado, que pode operar com sua própria janela de contexto, sem interferir no contexto principal da sessão de desenvolvimento.

A utilização de sub-agents organiza o fluxo de trabalho, permitindo que o desenvolvedor invoque um especialista conforme a necessidade. Por exemplo, após gerar um trecho de código, é possível acionar um sub-agent de revisão para analisar o material em busca de melhorias ou possíveis bugs. Essa modularidade torna o processo de desenvolvimento assistido por IA mais estruturado e eficaz.

Blog da CODARSE

Pesquisar este blog