Compartilhar via


Guia do runtime dos Clusters de Big Data do SQL Server para Apache Spark

Aplica-se a:SQL Server 2019 (15.x)

Important

Os Clusters de Big Data do Microsoft SQL Server 2019 foram desativados. O suporte para clusters de Big Data do SQL Server 2019 terminou em 28 de fevereiro de 2025. Para obter mais informações, consulte a postagem no blog de anúncios e as opções de Big Data na plataforma microsoft SQL Server.

Apresentando o runtime dos Clusters de Big Data do SQL Server para Apache Spark

O runtime dos Clusters de Big Data do SQL Server para Apache Spark é uma especificação padronizada do Apache Spark que permite interoperabilidade simplificada entre distribuições. Esse runtime do Spark é um bloco consistente e com controle de versão composto por distribuições de linguagem de programação, otimizações de mecanismo, bibliotecas principais e pacotes.

Cada produto que usa a especificação de runtime contém as mesmas versões do Apache Spark Core, PySpark, Scala Spark, Spark.R, sparklyr e .NET para Spark.

Todos os pacotes distribuídos e bibliotecas também são os mesmos. Uma das principais metas da especificação é proporcionar uma experiência de primeira classe a engenheiros de dados e cientistas de dados, com uma lista de pacotes e conectores constantemente coletados e atualizados.

Benefícios do runtime dos Clusters de Big Data do SQL Server para Apache Spark:

  1. Otimizações e recursos do mecanismo Spark disponíveis em todos os produtos e serviços
  2. Ritmo de lançamentos estabelecido
  3. Interoperabilidade perfeita entre produtos e serviços do Spark
  4. Pacotes coletados para engenheiros de dados e cientistas de dados
  5. História consistente de gerenciamento de pacotes

Ritmo de lançamentos e padrões de nomenclatura

A especificação do runtime dos Clusters de Big Data do SQL Server para Apache Spark especifica o seguinte:

Este é o padrão de nomenclatura do runtime:

"PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE#"

Por exemplo, "BDC.3.2021.1".

RELEASE# é um número semântico sequencial. Ele não está vinculado a meses ou nenhum outro padrão. Depois de criada, a versão do runtime é imutável. Cada versão dos Clusters de Big Data do SQL Server vem com uma versão do runtime.

O que há na versão atual do runtime?

As notas sobre a versão dos Clusters de Big Data do SQL Server mostram o nome do runtime e o conteúdo completo da versão.

Next steps

Para saber mais, confira Introdução a Clusters de Big Data do SQL Server.