MiniSoup HTML Parser (Editora Independente) (Pré-visualização)
Uma biblioteca de análise HTML leve inspirada no Beautiful Soup, fornecendo recursos para análise e extração de elementos HTML
Este conector está disponível nos seguintes produtos e regiões:
| Serviço | Class | Regiões |
|---|---|---|
| Estúdio Copiloto | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Aplicações Lógicas | Standard | Todas as regiões do Logic Apps , exceto as seguintes: - Regiões do Azure Government - Regiões do Azure China - Departamento de Defesa dos EUA (DoD) |
| Aplicações Power | Premium | Todas as regiões do Power Apps , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Automatize o poder | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Contato | |
|---|---|
| Nome | Suporte MiniSoup |
| URL | https://github.com/DEmodoriGatsuO/MiniSoup |
| demodori.gatsuo@gmail.com |
| Metadados do conector | |
|---|---|
| Editora | Shogo Shindo |
| Sítio Web | https://github.com/DEmodoriGatsuO/MiniSoup |
| Política de privacidade | https://github.com/DEmodoriGatsuO/MiniSoup/blob/main/PRIVACY.md |
| Categorias | Dados; Sítio Web |
Limites de Limitação
| Name | Chamadas | Período de Renovação |
|---|---|---|
| Chamadas de API por conexão | 100 | 60 segundos |
Ações
| Analisar tabela HTML |
Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas |
| Buscar conteúdo HTML |
Busca conteúdo HTML de um URL especificado |
| Encontrar todos os elementos correspondentes |
Localiza todos os elementos HTML correspondentes ao nome da tag especificado e atributos opcionais |
| Extrair valores de elementos HTML |
Extrai valores de atributos específicos de elementos HTML correspondentes ao seletor fornecido |
| Selecionar elementos HTML |
Seleciona elementos HTML correspondentes ao seletor fornecido |
Analisar tabela HTML
Analisa uma tabela HTML em dados estruturados com cabeçalhos e linhas
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Conteúdo HTML que contém a tabela |
|
table_selector
|
table_selector | string |
Seletor de CSS para localizar o elemento de tabela HTML |
|
|
header_rows_exist
|
header_rows_exist | boolean |
Se a tabela tem linhas de cabeçalho |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
Headers
|
data.Headers | array of string |
Cabeçalhos de coluna extraídos da tabela |
|
Rows
|
data.Rows | array of array |
Linhas da tabela, cada uma contendo uma matriz de valores de célula |
|
items
|
data.Rows | array of string |
Buscar conteúdo HTML
Busca conteúdo HTML de um URL especificado
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
URL
|
url | True | string |
URL para buscar conteúdo HTML |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
html
|
html | string |
Conteúdo HTML recuperado do URL especificado |
Encontrar todos os elementos correspondentes
Localiza todos os elementos HTML correspondentes ao nome da tag especificado e atributos opcionais
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Conteúdo HTML a ser analisado |
|
tag_name
|
tag_name | True | string |
Nome da tag HTML para pesquisar |
|
id
|
id | string |
Filtrar por ID do elemento |
|
|
classe
|
class | string |
Filtrar por classe de elemento |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que correspondem ao nome e atributos da tag especificados |
|
count
|
count | integer |
Número de elementos encontrados |
Extrair valores de elementos HTML
Extrai valores de atributos específicos de elementos HTML correspondentes ao seletor fornecido
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Conteúdo HTML a ser analisado |
|
selector
|
selector | True | string |
Seletor de CSS ou XPath para elementos de segmentação |
|
atributo
|
attribute | True | string |
Atributo para extrair de elementos selecionados. Use 'text' para texto interno, 'html' para HTML interno ou nome de atributo específico |
|
selector_type
|
selector_type | string |
Tipo de seletor a utilizar |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
values
|
values | array of string |
Matriz de valores extraídos dos elementos correspondentes |
|
count
|
count | integer |
Número de valores extraídos |
Selecionar elementos HTML
Seleciona elementos HTML correspondentes ao seletor fornecido
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
html
|
html | True | string |
Conteúdo HTML a ser analisado |
|
selector
|
selector | True | string |
Seletor de CSS ou XPath para elementos de segmentação |
|
selector_type
|
selector_type | string |
Tipo de seletor a utilizar |
Devoluções
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
sucesso
|
success | boolean |
Indica se a operação foi bem-sucedida |
|
elementos
|
elements | array of HtmlElement |
Matriz de elementos HTML que correspondem ao seletor especificado |
|
count
|
count | integer |
Número de elementos encontrados |
Definições
HtmlElement
Representa um elemento HTML com suas propriedades e atributos
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
etiqueta
|
tag | string |
O nome da tag HTML do elemento (por exemplo, 'div', 'span', 'a') |
|
outerHtml
|
outerHtml | string |
O HTML completo do elemento incluindo o próprio elemento |
|
innerHtml
|
innerHtml | string |
O conteúdo HTML dentro do elemento , que pode incluir outros elementos |
|
innerText
|
innerText | string |
O conteúdo de texto dentro do elemento com todas as tags HTML removidas |
|
attributes
|
attributes | object |
Todos os atributos do elemento como pares nome-valor |
|
isSelfClosing
|
isSelfClosing | boolean |
Indica se o elemento é uma tag de fechamento automático (por exemplo, |