text extraction

What kind of data should the tool work with?

Este producto puede filtrar o brindar formato a contenido de texto. También incluye un organizador de enlaces y documentos y capacidades de búsqueda. Por esto, es posible que sea más apropiado denominarlo como un sistema de administración de textos. Si el usuario tiene una gran cantidad de documentos guardados en la computadora y enlaces en línea que usa, esta es una aplicación de utilidad que le permite navegar en el entorno con más facilidad.

Code license: GNU GPL v3
Last updated: 15 Jun 2015

WebClust es un metabuscador que agrupa documentos en conjuntos significativos. WebClust presenta los resultados de la búsqueda en una disposición horizontal por tema, además de una única lista vertical. La técnica de minería de datos de WebClust está diseñada para dar sentido a la gran cantidad de información textual de la web, incluidas las bibliotecas digitales.

Last updated: 14 Jun 2015

PDFMiner es una herramienta de Python para extraer información de documentos PDF (no sólo texto, sino también información acerca de las fuentes, codificación y diseño).

Code license: MIT License
Last updated: 1 May 2015
CSV
Subscribe to text extraction