Partilhar via


MiniSoup HTML Parser (Editora Independente) (Pré-visualização)

Uma biblioteca de análise HTML leve inspirada no Beautiful Soup, fornecendo recursos para análise e extração de elementos HTML

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Suporte MiniSoup
URL https://github.com/DEmodoriGatsuO/MiniSoup
Email demodori.gatsuo@gmail.com
Metadados do conector
Editora Shogo Shindo
Sítio Web https://github.com/DEmodoriGatsuO/MiniSoup
Política de privacidade https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md
Categorias Dados; Sítio Web

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Analisar tabela HTML

Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas

Buscar conteúdo HTML

Busca conteúdo HTML de um URL especificado

Encontrar todos os elementos correspondentes

Localiza todos os elementos HTML correspondentes ao nome da tag especificado e atributos opcionais

Extrair valores de elementos HTML

Extrai valores de atributos específicos de elementos HTML correspondentes ao seletor fornecido

Selecionar elementos HTML

Seleciona elementos HTML correspondentes ao seletor fornecido

Analisar tabela HTML

Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas

Parâmetros

Name Chave Necessário Tipo Description
html
html True string

Conteúdo HTML que contém a tabela

table_selector
table_selector string

Seletor de CSS para localizar o elemento de tabela HTML

header_rows_exist
header_rows_exist boolean

Se a tabela tem linhas de cabeçalho

Devoluções

Name Caminho Tipo Description
sucesso
success boolean

Indica se a operação foi bem-sucedida

Headers
data.Headers array of string

Cabeçalhos de coluna extraídos da tabela

Rows
data.Rows array of array

Linhas da tabela, cada uma contendo uma matriz de valores de célula

items
data.Rows array of string

Buscar conteúdo HTML

Busca conteúdo HTML de um URL especificado

Parâmetros

Name Chave Necessário Tipo Description
URL
url True string

URL para buscar conteúdo HTML

Devoluções

Name Caminho Tipo Description
sucesso
success boolean

Indica se a operação foi bem-sucedida

html
html string

Conteúdo HTML recuperado do URL especificado

Encontrar todos os elementos correspondentes

Localiza todos os elementos HTML correspondentes ao nome da tag especificado e atributos opcionais

Parâmetros

Name Chave Necessário Tipo Description
html
html True string

Conteúdo HTML a ser analisado

tag_name
tag_name True string

Nome da tag HTML para pesquisar

id
id string

Filtrar por ID do elemento

classe
class string

Filtrar por classe de elemento

Devoluções

Name Caminho Tipo Description
sucesso
success boolean

Indica se a operação foi bem-sucedida

elementos
elements array of HtmlElement

Matriz de elementos HTML que correspondem ao nome e atributos da tag especificados

count
count integer

Número de elementos encontrados

Extrair valores de elementos HTML

Extrai valores de atributos específicos de elementos HTML correspondentes ao seletor fornecido

Parâmetros

Name Chave Necessário Tipo Description
html
html True string

Conteúdo HTML a ser analisado

selector
selector True string

Seletor de CSS ou XPath para elementos de segmentação

atributo
attribute True string

Atributo para extrair de elementos selecionados. Use 'text' para texto interno, 'html' para HTML interno ou nome de atributo específico

selector_type
selector_type string

Tipo de seletor a utilizar

Devoluções

Name Caminho Tipo Description
sucesso
success boolean

Indica se a operação foi bem-sucedida

values
values array of string

Matriz de valores extraídos dos elementos correspondentes

count
count integer

Número de valores extraídos

Selecionar elementos HTML

Seleciona elementos HTML correspondentes ao seletor fornecido

Parâmetros

Name Chave Necessário Tipo Description
html
html True string

Conteúdo HTML a ser analisado

selector
selector True string

Seletor de CSS ou XPath para elementos de segmentação

selector_type
selector_type string

Tipo de seletor a utilizar

Devoluções

Name Caminho Tipo Description
sucesso
success boolean

Indica se a operação foi bem-sucedida

elementos
elements array of HtmlElement

Matriz de elementos HTML que correspondem ao seletor especificado

count
count integer

Número de elementos encontrados

Definições

HtmlElement

Representa um elemento HTML com suas propriedades e atributos

Name Caminho Tipo Description
etiqueta
tag string

O nome da tag HTML do elemento (por exemplo, 'div', 'span', 'a')

outerHtml
outerHtml string

O HTML completo do elemento incluindo o próprio elemento

innerHtml
innerHtml string

O conteúdo HTML dentro do elemento , que pode incluir outros elementos

innerText
innerText string

O conteúdo de texto dentro do elemento com todas as tags HTML removidas

attributes
attributes object

Todos os atributos do elemento como pares nome-valor

isSelfClosing
isSelfClosing boolean

Indica se o elemento é uma tag de fechamento automático (por exemplo, ,
)