Freigeben über


Transformations-Editor für Ausdrucksextrahierung (Registerkarte Erweitert)

Auf der Registerkarte Erweitert des Dialogfelds Transformations-Editor für Ausdrucksextrahierung können Sie Eigenschaften für die Extrahierung angeben, wie z. B. Häufigkeit, Länge und ob Wörter oder Ausdrücke extrahiert werden sollen.

Weitere Informationen zur Begriffsextraktion finden Sie unter Term Extraction Transformation.

Optionen

Nomen
Gibt an, dass durch die Transformation nur einzelne Nomen extrahiert werden.

Nominaler Ausdruck
Gibt an, dass durch die Transformation nur nominale Ausdrücke extrahiert werden.

Nomen und nominaler Ausdruck
Gibt an, dass durch die Transformation sowohl Nomen als auch nominale Ausdrücke extrahiert werden.

Frequenz
Gibt an, dass es sich bei dem Ergebnis um die Häufigkeit des Begriffs handelt.

TFIDF
Gibt an, dass es sich bei dem Ergebnis um den TFIDF-Wert des Begriffs handelt. Das TFIDF-Ergebnis ist das Produkt von Ausdruckshäufigkeit und umgekehrter Dokumenthäufigkeit, definiert als: TFIDF des Ausdrucks T = (Häufigkeit von T) * log((Anz. Zeilen in der Eingabe)/(Anz. Zeilen mit T))

Schwellenwert für Häufigkeit
Gibt in Form eines Zahlenwertes an, wie oft ein Wort oder ein Ausdruck vorkommen muss, bevor die Extrahierung erfolgt. Der Standardwert lautet 2.

Maximale Ausdruckslänge
Gibt die maximale Länge des Ausdrucks in Worten an. Diese Option bezieht sich nur auf nominale Ausdrücke. Der Standardwert ist 12.

Ausdrucksextrahierung mit Unterscheidung nach Groß-/Kleinschreibung verwenden
Gibt an, ob bei der Extrahierung nach Groß-/Kleinschreibung unterschieden wird. Der Standardwert lautet False.

Konfigurieren der Fehlerausgabe
Geben Sie mit dem Dialogfeld Fehlerausgabe konfigurieren die Fehlerbehandlung für Zeilen an, die Fehler verursachen.

Siehe auch

Fehler- und Meldungsreferenz von Integration Services
Begriffsextraktionstransformations-Editor (Registerkarte "Begriffsextraktion")
Termextraktion-Transformation-Editor (Ausschluss-Tab)
Transformation für Ausdruckssuche