|
|
||||||||||||||||||||||||||||||||||||
|
Extractor ist eine patentierte Technologie, mit der aus beliebigen Texten die wesentlichen Inhalte zusammen gefasst werden können. Extractor wurde dafür ausgelegt, mit den gängigen Betriebssystemen Windows und Linux verwendbar zu sein, denn die freie Wahl des Betriebssystems ist ein zunehmend wichtiger Aspekt für IT-Lösungen. Das Extractor Software Development Kit (SDK) umfasst den Sourcecode in ANSI C und kann unter
verwendet werden. Anpassungen an weitere Plattformen sind auf Kundenwunsch möglich. Entsprechend der Forderung nach plattformübergreifender Verwendbarkeit enthält das Extractor SDK auch API-Schnittstellen für diese Entwicklungsumgebungen:
Diese Möglichkeiten von Extractor stehen Ihnen für die Ihrer eigenen Anwendung zur Verfügung:
Für den Themenbereich der automatisierten Zusammenfassung von Texten existieren viele Definitionen und Implementationen. Am bekanntesten sind heuristische und linguistische Verfahren sowie Verfahren nach Bayes. Extractor benutzt einen als Genetic bezeichneten Ansatz, der einen Lernprozess umfasst. Dieser ermöglicht dem Werkzeug den einfachen Wechsel von einem Themenbereich zum anderen. Andere Ansätze sind traditionellerweise auf ein bestimmtes Thema beschränkt und erfordern bei einen Wechsel des Themenbereichs größere Interventionen des Anwenders zur Anpassung. Eine detaillierte Diskussion finden Sie unter »Learning Algorithms for Keyphrase Extraction«. |