Analisador HTML miniSoup (Editor Independente) (versão prévia)
Uma biblioteca de análise html leve inspirada em Beautiful Soup, fornecendo recursos para análise e extração de elementos HTML
Esse conector está disponível nos seguintes produtos e regiões:
| Service | Class | Regions |
|---|---|---|
| Copilot Studio | Premium | Todas as regiões do Power Automate , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Aplicativos Lógicos | Standard | Todas as regiões dos Aplicativos Lógicos , exceto as seguintes: – Regiões do Azure Governamental - Regiões do Azure China - Departamento de Defesa dos EUA (DoD) |
| Power Apps | Premium | Todas as regiões do Power Apps , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Power Automate | Premium | Todas as regiões do Power Automate , exceto as seguintes: – Governo dos EUA (GCC) – Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Contato | |
|---|---|
| Nome | Suporte ao MiniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| demodori.gatsuo@gmail.com |
| Metadados do conector | |
|---|---|
| Publicador | Shogo Shindo |
| Website | https://github.com/DEmodoriGatsuO/MiniSoup |
| Política de privacidade | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Categorias | Dados; Site |
Limitações
| Nome | Chamadas | Período de renovação |
|---|---|---|
| Chamadas à API por conexão | 100 | 60 segundos |
Ações
| Analisar tabela HTML |
Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas |
| Buscar conteúdo HTML |
Busca conteúdo HTML de uma URL especificada |
| Extrair valores de elementos HTML |
Extrai valores de atributo específicos de elementos HTML que correspondem ao seletor fornecido |
| Localizar todos os elementos correspondentes |
Localiza todos os elementos HTML que correspondem ao nome da marca e atributos opcionais especificados |
| Selecionar elementos HTML |
Seleciona elementos HTML que correspondem ao seletor fornecido |
Analisar tabela HTML
Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
Conteúdo HTML que contém a tabela |
|
table_selector
|
table_selector | string |
Seletor de CSS para localizar o elemento de tabela HTML |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Se a tabela tem linhas de cabeçalho |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
Headers
|
data.Headers | array of string |
Cabeçalhos de coluna extraídos da tabela |
|
Rows
|
data.Rows | array of array |
Linhas de tabela, cada uma contendo uma matriz de valores de célula |
|
items
|
data.Rows | array of string |
Buscar conteúdo HTML
Busca conteúdo HTML de uma URL especificada
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
url
|
url | True | string |
URL para buscar conteúdo HTML de |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
HTML
|
html | string |
Conteúdo HTML recuperado da URL especificada |
Extrair valores de elementos HTML
Extrai valores de atributo específicos de elementos HTML que correspondem ao seletor fornecido
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
Conteúdo HTML a ser analisado |
|
seletor
|
selector | True | string |
Seletor de CSS ou XPath para elementos de destino |
|
atributo
|
attribute | True | string |
Atributo a ser extraído de elementos selecionados. Usar 'text' para texto interno, 'html' para HTML interno ou nome de atributo específico |
|
selector_type
|
selector_type | string |
Tipo de seletor a ser usado |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
values
|
values | array of string |
Matriz de valores extraídos dos elementos correspondentes |
|
count
|
count | integer |
Número de valores extraídos |
Localizar todos os elementos correspondentes
Localiza todos os elementos HTML que correspondem ao nome da marca e atributos opcionais especificados
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
Conteúdo HTML a ser analisado |
|
tag_name
|
tag_name | True | string |
Nome da marca HTML a ser pesquisado |
|
id
|
id | string |
Filtrar por ID do elemento |
|
|
classe
|
class | string |
Filtrar por classe de elemento |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
Elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que correspondem ao nome e atributos de marca especificados |
|
count
|
count | integer |
Número de elementos encontrados |
Selecionar elementos HTML
Seleciona elementos HTML que correspondem ao seletor fornecido
Parâmetros
| Nome | Chave | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
HTML
|
html | True | string |
Conteúdo HTML a ser analisado |
|
seletor
|
selector | True | string |
Seletor de CSS ou XPath para elementos de destino |
|
selector_type
|
selector_type | string |
Tipo de seletor a ser usado |
Retornos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
Elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que correspondem ao seletor especificado |
|
count
|
count | integer |
Número de elementos encontrados |
Definições
HtmlElement
Representa um elemento HTML com suas propriedades e atributos
| Nome | Caminho | Tipo | Description |
|---|---|---|---|
|
marca
|
tag | string |
O nome da marca HTML do elemento (por exemplo, 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
O HTML completo do elemento, incluindo o próprio elemento |
|
innerHtml
|
innerHtml | string |
O conteúdo HTML dentro do elemento, que pode incluir outros elementos |
|
innerText
|
innerText | string |
O conteúdo de texto dentro do elemento com todas as marcas HTML removidas |
|
attributes
|
attributes | object |
Todos os atributos do elemento como pares nome-valor |
|
isSelfClosing
|
isSelfClosing | boolean |
Indica se o elemento é uma marca de auto-fechamento (por exemplo, , |