Extractor ist aus einem Projekt zur Anwendung von künstlicher Intelligenz und maschinellem Lernen entstanden. Dabei stand insbesonders im Vordergrund, wie die starke Zunahme von Informationen und geistigem Eigentum, die vor allem über das Internet entsteht, verfeinert sowie mit Relevanz und Bestimmtheit ausgestattet werden kann. Anwendungen von künstlicher Intelligenz verbunden mit den Theorien über maschinelles lernen erwiesen sich dabei als effektiv.

Extractor, jetzt in Version 7.2, verwendet dabei die Resultate von Dr. Turneys Forschungen. Mit Extractor erhalten Entwickler ein bewährtes Werkzeug, das die Beschaffung von Informationen und vor allem die Darstellung Ihrer Bedeutung im Kontext wesentlich erleichtert. Die wissenschaftlichen Grundlagen für die Entwicklung von Extractor sind in den folgenden Aufsätzen enthalten:

     ¤     Turney, P.D. (2000).
Learning algorithms for keyphrase extraction.
Information Retrieval, 2 (4): 303-336.
 
     ¤     Mathieu, J. (1999).
Adaptation of a keyphrase extractor for Japanese text.
Proceedings of the 27th Annual Conference of the Canadian Association for Information Science (CAIS-99),
Sherbrooke, Quebec, pp. 182-189.
    ¤     Turney, P.D. (1999).
Learning to Extract Keyphrases from Text.
NRC Technical Report ERB-1057, National Research Council Canada.
     ¤     Turney, P.D. (1997).
Extraction of Keyphrases from Text: Evaluation of Four Algorithms.
NRC Technical Report ERB-1051, National Research Council Canada.

    ¤     Answering Subcognitive Turing Test Questions: A Reply to French

    ¤     Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL