DataRecognition

What kind of data should the tool work with?

Geospatial Data Abstraction Library (GDAL) is a translator library for vector and raster geospatial data formats that is released under an X/MIT style Open Source license by the Open Source Geospatial Foundation.

Code license: Open source, MIT License
Last updated: 7 Jun 2016

Objetos geográficos codificados para RSS. GeoRSS fue diseñado como una herramienta manejada comunitariamente, sencilla, para alimentar RSS de información geográfica.
Como RSS y Atom son los sistemas más relevantes para publicar y compartir información, se hace cada vez más importante que la ubicación sea descripta de manera interoperable para que las aplicaciones pueden solicitar, agregar, compartir y mapear las etiquetas geográficas.
RSS Mapa de centros de Humanidades Digitales

Last updated: 7 Jun 2016

Overview is a tool for analyzing large sets of documents. In includes a sophisticated search engine, word clouds, entity detection, and topic-based document clustering. If that’s not good enough, you can write your own plugins using the API. It is open source and you can run it on your own computer.

It was originally designed for investigative journalists, but it’s now also used for qualitative research, social media conversation analysis, legal document review, digital humanities, and more.

Overview is built to do several types of tasks:

Code license: Open source
Last updated: 9 Mar 2016

Combinado con Leptonica, la Biblioteca para el Procesamiento de Imágenes, Tesseract puede leer una gran variedad de formatos de imagen y convertirlos a texto en más de 40 idiomas.

Este código es un simple motor de OCR. No tiene formato de salida ni interfaz de usuario. Puede detectar tono fijo y texto proporcional. Sin embargo, en 1995 este motor estaba entre los 3 mejores en términos de precisión de caracteres, y opera tanto en Linux como en Windows. El código de programación está incluido en la versión de código abierto.

Code license: Open source, Apache License
Last updated: 27 Jan 2016

The Entity Authority Tool Set (EATS) is a web application for recording, editing, using and displaying authority information about entities. It is designed to allow multiple authorities to each maintain their own independent data, while operating on a common base so that information about the same entity is all in one place. EATS also comes with client tools for automatically looking up entities in a text by name and adding appropriate TEI markup.
Features:

  • A web API for importing and exporting entity data
Code license: Open source, GNU GPL
Last updated: 26 Jan 2016

Import.io es una plataforma web de software libre que pone el poder de la web legible por máquinas en manos de los usuarios. Usando sus herramientas se puede crear una API ( aplicación) o rastrear , scrapear una web entera en pocos minutos sin necesidad de contar con conocimientos de código.

Code license: Closed source
Last updated: 15 Jan 2016

Textal es una aplicación gratuita de iOS para el análisis de textos. Textal permite analizar documentos, cadenas de mensajes en Twitter y páginas web. También posibilita la creación nubes de texto con enlace a los datos fuente. Trae una memoria cargada con un gran número de textos en el dominio público. Las nubes de texto se pueden compartir fácilmente a través de Twitter o por correo electrónico.

Last updated: 18 Dec 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

Whatizit puede adquirir hasta 500.000 términos que se copian en el cuadro de texto, para ejecutar cualquier operación de segmentación de análisis de texto predefinida.

Last updated: 23 May 2015

Gamera es una serie de herramientas (bajo la Licencia Pública GNU) utilizada para el desarrollo de sistemas de reconocimiento de imágenes en documentos.
Las características son las siguientes:
- Los diccionarios especializados pueden crearse para asistir el análisis de tipo de registro específico.
-Funcionalidad extensible.
-Reconocimiento óptimo de caracteres (OCR por sus siglas en inglés) toolkit plugin

Code license: Open source, GNU GPL
Last updated: 22 May 2015

SMHO - Sincronizador de Metadata de Historia Oral (OHMS en sus siglas en inglés) es un conveniente y eficaz recurso para el acceso a la historia oral ofreciendo a los usuarios -> la capacidad de contar con buscador a nivel de palabra , una transcripción correlativa con el tiempo (contexto) o conectar a la entrevista indexada el término de búsqueda textual al momento correspondiente en la entrevista grabada en línea.

Code license: Open source
Last updated: 6 Apr 2015

Bitext ofrece tecnologías semánticas multilingües en el campo del Análisis de Texto vía API con servicios como Extracción de Entidades, Extracción de Conceptos, Análisis de Emociones y Categorización de Texto.

Last updated: 25 Mar 2015

Praat is software for the phonetic analysis of speech, including support for articulatory and speech synthesis.

Code license: GNU GPL v2
Last updated: 19 Feb 2015

The DocScanner app uses a device's built-in camera to scan documents. Features include image optimization, OCR, document type recognition (document, business card, receipt, etc.), autosorting, and ability to upload documents to Evernote, Dropbox, and Google Drive.

Code license: Closed source
Last updated: 29 Dec 2014
CSV
Subscribe to DataRecognition