Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este artigo descreve o processo organizacional para criar cargas de trabalho de IA no Azure. O artigo fornece recomendações para tomar decisões-chave de design e processo para a adoção de cargas de trabalho de IA em escala. Ele se concentra em orientações específicas de IA para organização de recursos e conectividade.
Estabeleça limites de governança para cargas de trabalho de IA
A governança de IA requer organização adequada de recursos e gerenciamento de políticas para garantir operações seguras, compatíveis e econômicas. Você deve criar limites de governança claros para proteger dados confidenciais e controlar o acesso a recursos de IA de forma eficaz. Veja como:
Crie grupos de gerenciamento separados para cargas de trabalho de IA internas e voltadas para a Internet. A separação do grupo de gerenciamento estabelece limites críticos de governança de dados entre aplicativos de IA externos ("online") e internos ("corporativos"). Essa separação impede que usuários externos acessem dados corporativos internos confidenciais enquanto você mantém os controles de acesso apropriados. A abordagem está alinhada com os princípios de arquitetura de grupo de gerenciamento de zona de aterrissagem do Azure e dá suporte à herança de políticas entre tipos de carga de trabalho.
Aplique políticas específicas de IA a cada grupo de gerenciamento. Comece com políticas base das zonas de aterragem do Azure e adicione definições de políticas Azure para Foundry, serviços Azure AI, Azure AI Search e Azure Virtual Machines. A aplicação de políticas garante uma governança uniforme de IA em toda a sua plataforma e reduz a supervisão manual de conformidade.
Implante recursos de IA em assinaturas específicas para cargas de trabalho. Os recursos de IA devem herdar políticas de governança de seu grupo de gerenciamento de carga de trabalho, em vez de assinaturas de plataforma. Essa separação evita gargalos de desenvolvimento que os controles da equipe de plataforma criam e permite que as equipes de carga de trabalho operem com autonomia adequada. Implante cargas de trabalho de IA em assinaturas de zona de aterrissagem de aplicativos em ambientes de zona de aterrissagem do Azure.
Estabeleça conectividade segura para cargas de trabalho de IA
A rede de IA engloba o projeto de infraestrutura de rede, medidas de segurança e padrões eficientes de transferência de dados para cargas de trabalho de IA. Você deve implementar controles de segurança e opções de conectividade adequados para evitar interrupções baseadas na rede e manter um desempenho consistente. Veja como:
Ative a Proteção contra DDoS do Azure para cargas de trabalho de IA voltadas para a Internet.A Proteção contra DDoS do Azure protege seus serviços de IA contra possíveis interrupções e tempo de inatividade causados por ataques distribuídos de negação de serviço. A proteção contra DDoS no nível da rede virtual defende contra inundações de tráfego que visam aplicativos voltados para a Internet e mantém a disponibilidade do serviço durante ataques.
Proteja o acesso operacional a cargas de trabalho de IA com o Azure Bastion. Use um jumpbox e o Azure Bastion para proteger o acesso operacional a cargas de trabalho de IA e evitar a exposição direta de interfaces de gerenciamento pela Internet. Essa abordagem cria um gateway seguro para tarefas administrativas, mantendo o isolamento de rede para recursos de IA.
Escolha a conectividade apropriada para fontes de dados locais. As organizações que transferem grandes quantidades de dados de fontes locais para ambientes de nuvem precisam de conexões de alta largura de banda para dar suporte aos requisitos de desempenho da carga de trabalho de IA.
Use o Azure ExpressRoute para transferência de dados de alto volume.O Azure ExpressRoute fornece conectividade dedicada para grandes volumes de dados, processamento em tempo real ou cargas de trabalho que exigem desempenho consistente. O ExpressRoute inclui um recurso FastPath que melhora o desempenho da via de dados ignorando o ExpressRoute gateway para determinados fluxos de tráfego.
Use o Gateway de VPN do Azure para transferência moderada de dados.O Gateway de VPN do Azure funciona bem para volumes de dados moderados, transferência de dados pouco frequente ou quando é necessário acesso público à Internet. O VPN Gateway oferece configuração mais simples e operação econômica para conjuntos de dados menores em comparação com a Rota Expressa. Use a topologia e o design apropriados para suas cargas de trabalho de IA, incluindo VPN site a site para conectividade entre locais e VPN ponto a site para acesso seguro a dispositivos.
Estabeleça a confiabilidade da IA em todas as regiões
A confiabilidade da IA requer posicionamento estratégico da região e planejamento de redundância para garantir desempenho consistente e alta disponibilidade. As organizações devem abordar a hospedagem de modelos, a localidade de dados e a recuperação de desastres para manter serviços de IA confiáveis. Você precisa planejar sua estratégia de implantação regional para evitar interrupções de serviço e otimizar o desempenho. Veja como:
Implemente sistemas de IA em várias regiões para ambientes de produção. As cargas de trabalho de IA de produção exigem hospedagem em pelo menos duas regiões para fornecer redundância e garantir alta disponibilidade. As implantações em várias regiões permitem failover e recuperação mais rápidos durante falhas regionais. Para Azure OpenAI no Foundry, utilize implementações globais que encaminhem automaticamente os pedidos para regiões com capacidade disponível. Para implantações regionais, implemente o Gerenciamento de API do Azure para balancear a carga de solicitações de API em pontos de extremidade de IA.
Verifique a disponibilidade do serviço de IA nas regiões de destino antes da implantação. Diferentes regiões fornecem níveis variados de disponibilidade de serviços de IA e suporte a recursos. Verifique a disponibilidade do serviço do Azure por região para confirmar se os serviços de IA necessários estão disponíveis. Os modelos de implantação do Azure OpenAI incluem opções de padrão global, provisionamento global, padrão regional e provisionamento regional com diferentes padrões de disponibilidade regional.
Avalie os limites de cota regionais e os requisitos de capacidade. Os serviços de IA do Azure têm limites de assinatura regionais que afetam implantações de modelos em grande escala e cargas de trabalho de inferência. Entre em contato com o suporte do Azure de forma proativa quando antecipar necessidades de capacidade que excedam as cotas padrão para evitar interrupções de serviço durante o dimensionamento.
Otimize o posicionamento de dados para aplicativos de geração aumentada de recuperação. O local de armazenamento de dados afeta significativamente o desempenho do aplicativo em cenários RAG. A colocalização de dados com modelos de IA na mesma região reduz a latência e melhora a eficiência da recuperação de dados, embora as configurações entre regiões permaneçam viáveis para requisitos de negócios específicos.
Replique ativos críticos de IA para regiões secundárias para assegurar a continuidade do negócio. A continuidade de negócios requer a replicação de modelos ajustados, conjuntos de dados RAG, modelos treinados e dados de treinamento para regiões secundárias. A replicação de ativos permite uma recuperação mais rápida durante interrupções e mantém a disponibilidade do serviço em diferentes cenários de falha.
Estabeleça uma base de IA
Uma base de IA fornece a infraestrutura principal e a hierarquia de recursos que dão suporte a cargas de trabalho de IA no Azure. Inclui a configuração de ambientes escaláveis e seguros que se alinham com as necessidades operacionais e de governança. Uma base sólida de IA permite a implantação e o gerenciamento eficientes de cargas de trabalho de IA. Também garante segurança e flexibilidade para o crescimento futuro.
Usar uma zona de aterrissagem do Azure
Uma zona de aterrissagem do Azure é o ponto de partida recomendado que prepara seu ambiente do Azure. Ele fornece uma configuração predefinida para recursos de plataforma e aplicativo. Quando a plataforma estiver instalada, você poderá implantar cargas de trabalho de IA em zonas de aterrissagem de aplicativos dedicadas.
Se sua organização usa zonas de aterrissagem do Azure para cargas de trabalho, continue a usá-las para cargas de trabalho que usam IA. Implementa as suas cargas de trabalho de IA em zonas de destino de aplicações normais, como você faria com qualquer outra carga de trabalho. Veja a IA nas zonas de destino Azure. A Figura 2 abaixo ilustra como as cargas de trabalho de IA se integram em uma zona de aterrissagem do Azure.
Figura 2. Carga de trabalho de IA em uma zona de aterrissagem do Azure.
Crie um ambiente de IA
Se você não usa uma zona de aterrissagem do Azure, siga as recomendações neste artigo para criar seu ambiente de IA. O diagrama a seguir mostra uma hierarquia de recursos de linha de base. Ele segmenta cargas de trabalho internas de IA e cargas de trabalho de IA voltadas para a Internet. As cargas de trabalho internas usam a política para negar o acesso on-line dos clientes. Esta separação protege os dados internos da exposição a utilizadores externos. O desenvolvimento de IA deve usar um jumpbox para gerenciar recursos e dados de IA.
Figura 3. Hierarquia de recursos de linha de base para cargas de trabalho de IA.
Próximos passos
A próxima etapa é criar e implantar cargas de trabalho de IA em seu ambiente de IA. Use os links a seguir para encontrar a orientação de arquitetura que atende às suas necessidades. Comece com arquiteturas de plataforma como serviço (PaaS). PaaS é a abordagem recomendada pela Microsoft para adotar IA.