Text

What kind of data should the tool work with?

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 16 May 2018

Omeka es un sistema de gestión de contenidos diseñado para la visualización de bibliotecas, museos, archivos y colecciones académicas y exposiciones.

Code license: Open source, GNU GPL
Last updated: 19 Feb 2018

Con DiscoverText, los usuarios pueden importar datos desde una amplia variedad de fuentes (como Facebook &amp, inicio de Twitter, texto simple, Word, Excel, comentarios públicos de YouTube, blogs o wikis, PDF, entre otros), codificarlos y generar nubes de palabras e informes.

Code license: Closed source
Last updated: 24 Feb 2017

Gephi software de gráficos que proporciona una manera de explorar datos a través de la visualización y análisis de redes.

Code license: Open source, GNU GPL v3
Last updated: 15 Feb 2017
Code license: Creative Commons
Last updated: 10 Jan 2017

Recogito is an online platform for collaborative document annotation.

Recogito provides a personal workspace where you can upload, collect and organize your source materials - texts and images - and collaborate in their annotation and interpretation. Recogito enables you to make your work more visible on the Web more easily, and to expose the results of your research as Open Data.

Code license: Open source, Apache License
Last updated: 21 Dec 2016

Jotform allows users to create web forms (for surveys, etc.) using a drag-and-drop interface.

Code license: Closed source
Last updated: 10 Aug 2016

EPPT allows users to encode image-based scholarly editions without having to know XML syntax. It automates or semi-automates repeating attributes, and provides templates to reduce errors and accelerate the encoding process.

Last updated: 9 Aug 2016

Scripto is an open-source tool for community transcription of documents, images, and multimedia files. Registered users are permitted to view digital files and transcribe them with an easy-to-use toolbar. The tool includes a versioning history and editorial controls to make public contributions more manageable, and supports the transcription of a wide range of file types.

Code license: Open source
Last updated: 11 Jul 2016

Recollection es una plataforma desarrollada por Zepheira para la Biblioteca del Congreso Nacional de Infraestructura de Información Digital y su Programa de Preservación (NDIIPP), permite a los usuarios crear y compartir interfaces integrables con colecciones digitales de patrimonio cultural. La Biblioteca del Congreso dio a conocer su más reciente versión de Recollection como Viewshare, construida para aumentar la facilidad para encontrar, utilizar y compartir el software del proyecto.

Code license: Open source, MIT License
Last updated: 6 Jul 2016

TXM

TXM es una multiplataforma de código abierto y libre basado en el software de análisis de texto Unicode, XML y TEI, y utiliza Windows, Mac OS X y Linux. Se encuentra también disponible como un software para portales compatibles J2EE (basados en GWT) para acceso en línea con control de acceso construido. (Para más información, consulte el portal de demostración: http://portal.textometrie.org/demo).

Code license: Open source, GNU GPL v3
Last updated: 29 Jun 2016

IBM AeroText is an information extraction system for developing knowledge-based content analysis applications.

Last updated: 15 Jun 2016

The DataTank is an open source tool that publishes data, stored in text-based files (e.g., CSV, XML, JSON) or in binary structures (e.g., SHP files, relational databases). The DataTank reads data from these structures and publishes them to the web using a URI as an identifier, providing these data in any format a user wants regardless of the original data structure. The DataTank requires a server with Apache2 or Nginx, mod rewrite enabled, PHP 5.4 or higher, Git, any database supported by Laravel 4.

Features

Last updated: 7 Jun 2016

Quadrigram describe un "ambiente de programación visual" para datos activos. Es una herramienta para la visualización de datos basada en la web que permite a los usuarios personalizar y publicar visualizaciones a partir de una serie de tipos de datos. Las posibilidades de visualización van desde tablas y gráficos básicos (por ejemplo, gráfico de torta, gráfico de barras), a visualizaciones más sofisticadas para explorar set de datos complejos (por ejemplo, redes, datos geográficos, mapas de árbol con función para ampliar, cuadrificación, flujo acumulado).

Code license: Closed source
Last updated: 22 May 2016

El HathiTrust Research Center (HTRC) provee acceso a los investigadores a los textos de dominio público de la biblioteca HathiTrust Digital Library. Es un centro de investigación y colaboración fundado en conjunto por la Universidad de Indiana y la Universidad de Illinois junto con la biblioteca de HathiTrust Digital Library.

Last updated: 22 May 2016

Motor de (reconocimiento óptico de caracteres) para la creación de archivos electrónicos editables y de búsqueda de documentos en papel escaneados, archivos PDF y fotografías digitales.
Características:
Reconocimiento de imágenes de cámara digital y cámara de teléfono móvil
Reconocimiento de idioma
Integración completa con aplicaciones de Office
Conversión de PDF, archivo y seguridad

Code license: Closed source
Last updated: 17 May 2016

CLAW es el software del idioma inglés para llevar a cabo el etiquetado gramatical (POS, por sus siglas en inglés). La clasificación de palabras en una o más categorías basada en su definición, su relación con otras palabras y otros contextos, también conocida como “etiquetado de clase de palabras”.

Code license: Closed source
Last updated: 3 May 2016

DM is an environment for the study and annotation of images and texts. It is a suite of tools, enabling scholars to gather and organize the evidence necessary to support arguments based in digitized resources. DM enables users to mark fragments of interest in manuscripts, print materials, photographs, etc. and provide commentary on these resources and the relationships among them.

Last updated: 1 May 2016

Text 2 Mind Map es una herramienta web para mapeo mental. Cuenta con una interfaz muy básica y funcional. Requiere que el usuario estructure la información fuera de línea en un texto lineal, que se devuelve como un diagrama.

Code license: Closed source
Last updated: 22 Mar 2016

AroniSmartIntelligence™ is an application that performs text analytics on RSS articles, reviews, feedback, chat data or other unstructured texts organized into sub-folders. The output may be further input into other advanced statistical analytics or data mining modules available in AroniSmartIntelligence™, including regression analysis, econometrics, segmentation and Bayesian models.

Code license: Closed source
Last updated: 18 Mar 2016

CloudConvert supports the conversion between more than 200 different audio, video, document, ebook, archive, image, spreadsheet and presentation formats.

The CloudConvert API offers the full functionality of CloudConvert and makes it possible to use the conversion services in your own applications.

Code license: Closed source
Last updated: 10 Mar 2016

Overview is a tool for analyzing large sets of documents. In includes a sophisticated search engine, word clouds, entity detection, and topic-based document clustering. If that’s not good enough, you can write your own plugins using the API. It is open source and you can run it on your own computer.

It was originally designed for investigative journalists, but it’s now also used for qualitative research, social media conversation analysis, legal document review, digital humanities, and more.

Overview is built to do several types of tasks:

Code license: Open source
Last updated: 9 Mar 2016

A software application that enables a user to search, manipulate and publish large SGML/XML documents. Anastasia was developed within an academic context to enable the manipulation of a single, large mark-up documents or a set of documents. It utilises two methods to interpret the structure of a mark-up document: First, it uses pattern-matching algorithms to process a hierarchical tree, similar to other XML software applications; Second, it interprets the document structure as a series of sequential 'events' which must be processed.

Code license: Open source, GNU GPL
Last updated: 23 Feb 2016

TAToo is an embeddable Flash widget that displays TAPOR analytics for the page on which it resides.

Code license: Apache License
Last updated: 23 Feb 2016

Philomine es una extensión para el motor de recuperación de texto Philologic que puede efectuar diferentes tareas para el aprendizaje por computadora, la minería de texto y la agrupación de documentos.

Code license: Open source, GNU GPL
Last updated: 22 Feb 2016

PhiloLine is an add-on for the Philologic text retrieval engine that provides a sequence alignment algorithm for humanities text analysis designed to identify "similar passages" in large collections of texts.

Code license: Open source, GNU GPL
Last updated: 22 Feb 2016

A graphical user interface tool for Latent Dirichlet Allocation topic modeling.

Last updated: 17 Feb 2016

Sigil es un editor de libros electrónicos, con multiplataformas, de código abierto y libre, diseñado especialmente para editar libros en formato EPUB.

  • Soporte UTF-16 completo y soporte EPUB 2 completo
  • Múltiples vistas: vista de código (control completo sobre la edición directa de la sintaxis en formato EPUB), vista de libro (WYSIWYG), y vista previa
Code license: Open source, GNU GPL v3
Last updated: 3 Feb 2016

Combinado con Leptonica, la Biblioteca para el Procesamiento de Imágenes, Tesseract puede leer una gran variedad de formatos de imagen y convertirlos a texto en más de 40 idiomas.

Este código es un simple motor de OCR. No tiene formato de salida ni interfaz de usuario. Puede detectar tono fijo y texto proporcional. Sin embargo, en 1995 este motor estaba entre los 3 mejores en términos de precisión de caracteres, y opera tanto en Linux como en Windows. El código de programación está incluido en la versión de código abierto.

Code license: Open source, Apache License
Last updated: 27 Jan 2016

A Python-based XML web publishing framework which enables dynamic pipelining of XSLT transformations. Data is processed by an XML pipeline composed of several WSGI applications and middleware components.

Features:

  • Apache Cocoon Sitemap 1.0 compatible
  • WSGI modularity
  • URI pattern matching
Code license: Open source, GNU GPL
Last updated: 26 Jan 2016

Google Docs is an online environment for editing and sharing documents, spreadsheets, presentations, forms, drawings, and tables. Google Docs documents can be public or private, or shared with anyone with a Google account, e-mailed, or downloaded in various formats, including conversions to PDF and other formats not identical to the original or to the proprietary format used at creation. Designated people with whom items are shared can be given permission to comment or edit the files, thus providing a quick way to collaborate on creating and editing documents and presentations.

Code license: Closed source
Last updated: 26 Jan 2016

Figshare es un repositorio donde los usuarios pueden hacer que todos sus productos de investigación a disposición de manera citable, compartible y reconocible. Todos los formatos de archivo se pueden publicar, incluyendo videos y conjuntos de datos que a menudo están resumidos a la sección de materiales suplementarios en los modelos actuales de publicación. Los usuarios del sitio mantienen el control total sobre la gestión de su investigación, mientras se benefician del acceso global, control de versiones y copias de seguridad seguras en la nube.

Code license: Closed source
Last updated: 29 Dec 2015

Textal es una aplicación gratuita de iOS para el análisis de textos. Textal permite analizar documentos, cadenas de mensajes en Twitter y páginas web. También posibilita la creación nubes de texto con enlace a los datos fuente. Trae una memoria cargada con un gran número de textos en el dominio público. Las nubes de texto se pueden compartir fácilmente a través de Twitter o por correo electrónico.

Last updated: 18 Dec 2015

Superfastmatch está diseñado para encontrar duplicados exactos de cadenas de texto entre documentos.

Code license: Open source, GNU GPL
Last updated: 1 Dec 2015

Unlock Text is a powerful geoparser that can search text hosted on the web in txt or html format for references to locations. These locations are then returned ready for use in your results page, web map or any other application.

The Unlock Text API provides access to two parsers, the Edinburgh Geoparser from the Edinburgh Language Technology Group and the CLAVIN parser.

Code license: Open source
Last updated: 19 Nov 2015

Corpkit es una herramienta para llevar a cabo recopilación lingüística. Hace un montón de cosas usuales como análisis, concordancia y selección de palabras claves, pero además extiende su potencial de manera significativa: el usuario puede hacer concordancia a través de la búsqueda de combinaciones de características léxicas y gramaticales y puede hacer selección de palabras claves de lemas, de subcorpora comparado con corpora, o de palabras en ciertas posiciones dentro de las cláusulas.

Code license: MIT License
Last updated: 30 Oct 2015

NVivo es un software comercial que realiza el análisis cualitativo de data desestructurados, en una variedad de formatos y diversas fuentes. Permite que los usuarios recolecte, organice y analice el contenido de entrevistas, se focalice en grupos de discusión, encuestas, audios, medios sociales y sitios webs.

Code license: Closed source
Last updated: 30 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

Data Dictionary Generator está dirigido a la comunidad de edición TEI y tiene como objetivo ejecutarse dentro de oXygen. El diccionario Data Dictionary Generator (DDG) genera perfiles de cada uno de los elementos y atributos que aparecen en un archivo TEI. Cada entrada incluye una definición de las pautas de TEI, una representación, una definición específica del proyecto (si hubiere), un breve panorama de cómo se está utilizando realmente el elemento o atributo.

Last updated: 2 Oct 2015

Aimed at the TEI editing community and intended to be run inside oXygen, the Data Dictionary Generator (DDG) generates profiles of every element and attribute appearing in a TEI file. Each entry includes a definition from the TEI Guidelines, a local, project-specific definition (if provided), and a brief snapshot of how the element or attribute is actually being used. By making it easy to compare these three things, the DDG aims to help project editors reflect on current practice within their projects and quickly create stronger encoding guidelines for their collaborators.

Last updated: 28 Sep 2015

A cross-platform XML editor that may be used to create and validate XML documents and associated schema. It fully supports XSL (both XSLT and FO), DTD, Schema (Relax RNG and W3C), Database, XQuery and CSS. OXygen XML Editor works with all XML-based technologies, including XML databases, XProc pipelines, and web services and comes with ready-to-use DITA, DocBook, TEI, and XHTML support.

Frequently updated and supported, and with a very large set of features, this software tool has proved popular with digital humanists.

Code license: Closed source
Last updated: 10 Sep 2015

Joomla is an open source content management system (CMS), enabling users to build websites and applications.

Code license: Open source, GNU GPL v2
Last updated: 8 Sep 2015

Captivate is software for recording audio and video of a user's screen. Users can import PowerPoint slides and add rich media, simulations, and quizzes, and publish them to learning management systems that support the SCORM standard.

Last updated: 8 Sep 2015

CONTENTdm es un software de gestión de colecciones digitales que permite subir, describir, manejar y acceder a colecciones digitales. CONTENTdm es más comúnmente utilizado en bibliotecas, archivos, museos, agencias gubernamentales, universidades, corporaciones, sociedades históricas y otras organizaciones que deseen tener una colección digital.

Entre sus características encontramos las siguientes:

Code license: Closed source
Last updated: 7 Sep 2015

Stanza permite leer libros en tu iPhone, iPod Touch y iPad. Stanza soporta HTML, PDF, Microsoft Word y el formato de texto enriquecido de lectura, así como todos los principales protocolos de libros electrónicos.
Los desarrolladores pueden sumar actualizaciones de nuevos formatos a la API del programa ya que es open source.

Last updated: 22 Aug 2015

DEVONthink es una base de datos que ayuda al usuario a organizar, manejar y colaborar con archivos digitales, como archivosen Office, vínculos, correos electrónicos, datos de la investigación y documentos en PDF

Code license: Closed source
Last updated: 10 Aug 2015

DH Press (llamado originariamente DiPh) es una herramienta que contiene una conexión con WordPress de fácil uso, la cual permite que cualquier tipo de usuario visualice y reutilice (mashup) información histórica y geográfica, documentos y varios tipos de contenido multimedia para desarrollar proyectos de humanidades digitales.

Code license: Open source
Last updated: 10 Aug 2015

Plone es un potente y flexible sistema de gestión de contenido de código abierto (CMS) construido sobre el servidor de aplicaciones Zope y sobre CMF.

Características:

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 7 Aug 2015

CiteULike es un servicio gratuito para ayudarle a almacenar, organizar y compartir los trabajos académicos que esté leyendo. Cuando encuentra un documento en la web que le interesa, puede hacer clic en un botón y hacer que agrege a su biblioteca personal. CiteULike extrae automáticamente los datos para la cita bibliográfica, para no tener que tipearlos. Todo funciona desde dentro de su navegador web por lo que puede acceder a su biblioteca desde cualquier ordenador con conexión a Internet.

Code license: GNU GPL
Last updated: 5 Aug 2015

VisualEyes es una herramienta web de autoría desarrollada en la Universidad de Virginia para unir imágenes, mapas, gráficos, vídeo y datos en visualizaciones dinámicas altamente interactivas y atractivas.

Code license: Open source
Last updated: 3 Aug 2015

Xendo es una herramienta en línea de investigación que ofrece la búsqueda unificada a través de almacenamiento basado en la nube (como Dropbox, Evernote, Google Drive, onedrive) y correo electrónico (como Gmail, Oficina 365) y otros servicios tales como Slack, Trello y Asana (25 integraciones hasta la fecha). Xendo ofrece capacidades de búsqueda avanzadas tales como busqueda por proximidad (en busca de término o frase dentro de una serie de palabras de un segundo término o frase). Xendo utiliza OCR (Optical Character Recognition) para hacer búsquedas en documentos escaneados.

Last updated: 2 Aug 2015

Las principales utilidades de Citavi son la gestión de referencias, la organización del conocimiento, y la planificación de las tareas.

Gestión de Referencias

Code license: Closed source
Last updated: 2 Aug 2015

Perl es un lenguaje de programación dinámico, de propósito general, y de interpretación, de alto nivel. Originalmente desarrollado para la manipulación de texto, ahora se utiliza para una amplia gama de tareas, incluyendo la programación de gráficos, administración de sistemas, programación de la red, aplicaciones que requieren acceso a bases de datos y la programación CGI en la Web.
Características:
     Secuencias de comandos shell (sh), AWK, y sed
     Poderosas utilidades de procesamiento de texto
     Flexibilidad y adaptabilidad

Code license: Open source, GNU GPL
Last updated: 2 Aug 2015

Zenodo construye y opera un servicio sencillo e innovador que permite a los investigadores, científicos, proyectos de la UE e instituciones compartir, preservar y mostrar los resultados de investigaciones multidisciplinarias (datos y publicaciones) que no forman parte de los repositorios institucionales o temáticos existentes de las comunidades de investigación .

Code license: GNU GPL
Last updated: 2 Aug 2015

Editors' Notes es una herramienta basada en la web de código abierto para la grabación, organización, conservación, y el acceso a las notas de apertura de investigación, construido para las necesidades de los proyectos de edición de documentales, archivos y bibliotecas de colecciones especiales.

Code license: Open source
Last updated: 8 Jul 2015

Cirilo es una aplicación desarrollada para la conservación de contenidos y la preservación de datos en los sistemas de repositorios basados en Fedora. Incluye la creación y gestión de objetos, control de versiones, la normalización y estandars, y la elección de los formatos de datos.

Code license: Open source
Last updated: 8 Jul 2015

Microsoft OneNote es una libreta virtual que permite al usuario guardar notas e información en un solo entorno y realizar búsquedas en libretas compartidas para agilizar la administración de información y el trabajo con otros. OneNote era un software pago, pero ahora es gratuito en todas las plataformas.

Code license: Closed source
Last updated: 5 Jul 2015

El paquete “Stylo” ofrece implementaciones de fácil uso de varios análisis establecidos en el campo de la estilística computacional, en los que se incluyen la atribución de autoría no tradicional, el reconocimiento de género,el desarrollo del estilo (“estilo-cronometría), etc. El paquete incluye un número de métodos explicativos provistos por la función “stylo() (escalamiento multidimensional, análisis de componentes principales, análisis de conglomerados, árboles de consenso de arranque).

Last updated: 16 Jun 2015

Open Science Framework (OSF) es una herramienta de código abierto gratuita diseñada para que los investigadores administren el flujo de trabajo de investigación en su totalidad: la planificación, la ejecución, la generación de informes, el archivado y el descubrimiento. Es en parte un software colaborativo y en parte, un sistema de control de versión. Se puede usar OSF para administrar proyectos individuales o proyectos colaborativos más extensos.

Code license: Apache License
Last updated: 14 Jun 2015

Coggle es una herramienta web utilizada para la visualización y la estructuración no linear de información. Permite crear de manera fácil diagramas visualmente atractivos con poco o nada de conocimiento técnico. Permite formatos como Markdown y LaTeX (use LaTeX a través de secuencias de escape \\( \\) or \\[ \\])- Los usuarios pueden agregar imágenes al arrastrarlas y soltarlas en el navegador, ver el historial de diagrama para cada historia y volver a estados anteriores, y descargar sus trabajos con formato PDF o de imagen.

Code license: Closed source
Last updated: 9 Jun 2015

Textpresso es un sistema de minería de texto para literatura científica. Los dos elementos principales de Textpresso son (1) el acceso al texto completo, de modo que se pueden hacer búsquedas en artículos enteros, y (2) el uso de categorías de conceptos y clasificaciones de la biología que denotan una relación con un objeto dado (por ejemplo, asociación, regulación, etc.) o que lo describen (por ejemplo, métodos, etc.).

Code license: Open source
Last updated: 28 May 2015

OxGarage es un sitio y un servicio REST diseñado para transformar documentos que presentan una amplia variedad de formatos. La mayoría de las transformaciones usan el formato de codificación de caracteres (Text Enconding Initiative) como formato pivote.
OXGarage está basado en Enrih Garage Engine desarrollado por Poznan Supercompting y Networking Center y Oxford University Computing Services para el proyecto ENRICH.
Consulte el siguiente vínculo para más detalles: conversion matrix

Code license: Open source
Last updated: 27 May 2015

Tesla es un entorno virtual de investigación para la ingeniería de textos; un marco de referencia que se puede usar para crear experimentos en corpus lingüísticos y para desarrollar nuevos algoritmos para el procesamiento del lenguaje natural. Tesla es una aplicación cliente-servidor que los investigadores pueden utilizar para sí mismos o para grupos de trabajo. La captura de pantalla que se encuentra a continuación muestra el editor de prueba de la aplicación de Tesla Client.

Last updated: 24 May 2015

Event Structure Analysis fue desarrollado en la Universidad de Indiana y consiste en tres componentes: Ethno, análisis de requisitos previos y análisis de composición. Ethno es un programa en línea de Java que permite analizar eventos secuenciales; el análisis de requisitos previos genera un diagrama que muestra la conexión de los eventos; y el análisis de composición muestra el agente, la acción, el objeto del código, y otras características de cada suceso.

Last updated: 24 May 2015

AnSWR permite realizar análisis cuantitativos de datos lingüísticos, gracias a un conjunto de métodos para organizar, mostrar, procesar, resumir e interpretar información.

Última actualización: 23/9/2005

Solo disponible para Windows 2000 y Windows XP.

Last updated: 24 May 2015

Realiza búsquedas que se correlacionan con datos reales: Google Correlate encuentra patrones de búsqueda que se corresponden con tendencias reales.

Last updated: 24 May 2015

Whatizit puede adquirir hasta 500.000 términos que se copian en el cuadro de texto, para ejecutar cualquier operación de segmentación de análisis de texto predefinida.

Last updated: 23 May 2015

Weft QDA es una herramienta gratuita de código abierto para análisis de datos de textos. Permite importar documentos de formato de texto simple o PDF, aplicar notas a código del nivel de carácter, a categorías y a documentos, recuperar texto codificado, aplicar estadísticas de codificación sencillas, realizar búsquedas de texto libre y exportar a formatos HTML y CSV.

Last updated: 23 May 2015

HyperRESEARCH permite que los usuarios puedan codificar y recuperar, desarrollar teorías y realizar análisis de datos. El usuario puede trabajar con fuentes de texto, de gráficos, de audio o de video.

Last updated: 23 May 2015

WordSmith permite a los usuarios desarrollar concordancias, encontrar palabras claves y desarrollar lista de palabras a partir de archivos de textos planos.

Last updated: 22 May 2015

Qualrus es una herramienta de análisis de información cualitativa e innovadora que ayuda a manejar datos no estructurados. Además, Qualrus aprende las tendencias de codificación del usuario, brinda una red de display semántica visual, aconseja a los usuarios y ofrece soporte técnico.

Last updated: 22 May 2015

El Analizador Macro-Etimológico (Macro-Etymological Analyzer, en inglés) es una aplicación web para el análisis de textos que busca todas las palabras de un texto dado en la red global etimológica (Etymological Wordnet) y genera estadísticas respecto de la etimología macro del texto, organizando las palabras según la raíz lingüística. Por ejemplo, puede analizar una novela y calcular las proporciones de palabras de origen anglosajón o afroasiático.

Code license: GNU GPL v3
Last updated: 20 May 2015

Diction analiza textos a nivel lingüístico para indicar rasgos como certeza, actividad, optimismo, realismo y frecuencia.

Last updated: 19 May 2015

Cucumber permite a los equipos de desarrollo de programas describir cómo debe comportarse en texto simple el programa. El texto está escrito en un lenguaje legible en un dominio específico y sirve como documentación, pruebas automáticas y ayuda para el desarrollo, todo en un único formato.

Last updated: 19 May 2015

Lexos es una herramienta en línea que permite al usuario "restregar" (limpiar) los textos, cortar fragmentos en diferentes tamaños, manejar los fragmentos y conjuntos de fragmentos, y elegir a partir de una gama de herramientas de análisis para investigar estos textos.Sus funciones incluyen la construcción de dendogramas, la realización de gráficos sobre promedios móviles de frecuencias de palabras o proporciones de palabras o letras, y el juego con las visualizaciones de las frecuencias de palabras, como nubes de palabras y visualización en burbujas.

Code license: Open source
Last updated: 17 May 2015

RSiena es un paquete para lenguaje en R que habilita el análisis estadístico de datos de red, lo que incluye datos longitudinales y transversales de la red y datos longitudinales de la red y su comportamiento. Brinda la misma funcionalidad que el software SIENA (Simulation Investigation for Empirical Network Analysis) de Windows, que ya no se actualiza.

Code license: Open source, GNU GPL v2
Last updated: 13 May 2015

AntWordProfiler es un software libre para el análisis de texto. En este caso analiza la frecuencia de palabras.

Last updated: 9 May 2015

Tumblr es una plataforma de blogs y microbloggs, enfocada en el intercambio de datos entre blogs individuales. Los usuarios pueden crear y difundir datos en un editor visual o HTML, utilizando formatos estándar Tumblr para publicación: texto, foto, cita, enlace, chat, audio y video.

Code license: Open source
Last updated: 9 May 2015

TypePad es una plataforma comercial de host comlpeto para blogging, Proporciona bibliotecas de diseños personalizados de blogs.

Code license: Closed source
Last updated: 9 May 2015

Greenstone es un conjunto de programas informáticos para la construcción y distribución de librerías y colecciones de documentos digitales. También permite a los usuarios publicarlas en Internet o CD-ROM. La interfaz de software y documentación está disponible en Inglés, francés, español, ruso y kazajo.

Code license: Open source, GNU GPL
Last updated: 8 May 2015

Juxta es una herramienta de escritorio multiplataforma y de código abierto para comparar y compilar varios testimonios, convirtiéndolos en un único texto. El programa permite configurar cualquiera de los testimonios como texto de base, agregar o quitar testimonios, cambiar el texto base, hacer anotaciones a las comparaciones generadas por Juxta y guardar los resultados.

Code license: Open source, Creative Commons
Last updated: 4 May 2015

Quirkos es un software de análisis de texto para principiantes interesados en investigación cualitativa. Permite usar visualizaciones en tiempo real como interfaz . Admite operaciones de codificación-recuperación , búsquedas y consultas (queries) sobre datos. Sumado a ello, visualiza relaciones entre tópicos y temas.
Puedes encontrar más información en el siguiente link: http://www.quirkos.com/qualitative-data-analysis-software.html

Code license: Closed source
Last updated: 3 May 2015

LiveJournal es una plataforma de publicación comunitaria, con los rasgos característicos tanto de blogs como de plataformas de redes sociales. El sitio es de larga data, originalmente fundado en 1999 como una plataforma de bloggin y una comunidad en línea en torno periódicos personales. Actualmente cuenta con más de 50 millones de periódicos, en particular enfocados en la política, el entretenimiento, la moda, la literatura y el diseño.

Code license: Open source
Last updated: 2 May 2015

Aplicación multiplataforma para el análisis de texto, video y hojas de cálculo (análisis cualitativo, cuantitativo y métodos mixtos de investigación)

Last updated: 2 May 2015

Linguistic Inquiry and Word Count es un software de análisis de texto que calcula en qué medida ( "grados" ) las personas usan diferentes categorías de palabras en una determinada selección de textos.

Last updated: 2 May 2015

Evernote es un software para archivar y gestionar notas o apuntes en la nube. Se pueden crear carpetas de notas de forma privada o pública . Los usuarios pueden tomar notas de texto, subir archivos para adjuntarlos a dichas notas o carpetas.
Evernote incorpora la opción OCR para imágenes con texto impreso o manuscrito.
Tiene una versión premium que permite el acceso de las notas de forma offline , mayor capacidad de almacenamiento y búsqueda de archivos PDF´s.

Code license: Closed source
Last updated: 2 May 2015

ANTHROPAC es un programa basado en menú DOS para recolectar y analizar datos de dominio cultural.
Recolecta y analizada data estructurada tanto cuantitativa como cualitativa. Ofrece herramientas analíticas y multi- variable.

Last updated: 2 May 2015

Leximancer es un software de análisis de texto que puede crear visualizaciones en base a red de conceptos y tópicos. También incluye análisis de sentimientos (análisis conocido como minería de opinión)

Last updated: 2 May 2015

Sophie es una herramienta electrónica para la creación, colaboración, lectura, y publicación de los documentos de los medios de comunicación ricos en entornos de red. Construido en Java, se ejecuta en una variedad de plataformas.

No es compatible con cualquiera de los formatos epub o mobi aunque utiliza su propio formato interno.

El desarrollo del proyecto parece haberse estancado.

Last updated: 1 May 2015

SearchTeam es un motor colaborativo de búsqueda que permite a los individuos y grupos para curar resultados de búsqueda en un SearchSpace público o compartido.

Code license: Closed source
Last updated: 1 May 2015

Luego de crear una cuenta gratuita, los usuarios pueden hacer minería de datos y analizar el contenido de JSTOR. Al enviar una solicitud de búsqueda, el usuario recibirá una muestra aleatoria de 1,000 documentos de entre los 4.6 millones alojados en JSTOR; se pueden recibir más documentos contactando a JSTOR directamente. Los usuarios pueden elegir recibir los siguientes resultados:

Last updated: 29 Apr 2015

Importar, transformar, almacenar e indexar datos tiene que ser fácil.

Catmandu provee una suite de módulos Perl para facilitar la importación, almacenamiento, recuperación, exportación y transformación de los registros de metadatos. Combina módulos con frameworks de aplicaciones web como PSGI/Plack, almacenes de documentos como MongoDB e índices a texto completo como Solr para crear un entorno de desarrollo rápido para servicios de biblioteca digital como repositorios institucionales y motores de búsqueda.

Code license: GNU GPL v3
Last updated: 22 Apr 2015

Scrivener es un programa que permite escribir y organizar notas virtuales y bosquejos gestionando las versiones, opciones de importación - exportación y plantillas de guión . Ofrece un sistema de gestión de notas, documentos y metadata.

Habilita la creación de documentos desde otros secundarios , desde ebook ( epub , kindle/mobi) , tanto como la exportación a TeX, LaTex y formato de Documento Abierto ( en inglés Open Document Format ), PDF y Microsoft Word.

La versión para Linux está en beta. iOS en desarrollo aún.

Code license: Closed source
Last updated: 18 Aug 2015

Commentpress es un plugin para personalizar un tema de WordPress.Permite realizar comentarios pormenorizados al margen del texto. Comentarios colaborativos sobre un texto, párrafo, etc.

Code license: Open source, GNU GPL
Last updated: 6 Apr 2015

CollateX es un programa de Java para recolectar fuentes textuales, por ejemplo, para producir un texto crítico. A enero de 2012, el proyecto estaba en un estado de desarrollo incipiente y la documentación estaba incompleta.

Code license: GNU GPL v3
Last updated: 25 Mar 2015

Bitext ofrece tecnologías semánticas multilingües en el campo del Análisis de Texto vía API con servicios como Extracción de Entidades, Extracción de Conceptos, Análisis de Emociones y Categorización de Texto.

Last updated: 25 Mar 2015

JGAAP es un programa para el análisis textual, la categorización de textos y la atribución de autoría.

Last updated: 25 Mar 2015

TAMS Analyzer es un programa que funciona con TAMS y permite asignar códigos etnográficos a fragmentos de un texto simplemente seleccionando el texto correspondiente y haciendo doble clic en el nombre del código de una lista. Una vez hecho esto, permite extraer, analizar y guardar la información codificada.

Code license: Open source, GNU GPL
Last updated: 24 Mar 2015

TextSTAT es un programa simple para el análisis de textos. Lee archivos de texto sin formato (en diferentes codificaciones ) y archivos HTML (directamente desde Internet), y genera listas y concordancias de frecuencia de palabras a partir de los mismos. Incluye un motor de búsqueda automático que lee las páginas web que se le indique y genera con ellas un corpus de TextStat. También posee un lector de noticias que coloca mensajes de noticias en un archivo de corpus legible para TextStat .

Last updated: 24 Mar 2015

Oracle Database is a powerful and extensive relational database management system (RDBMS). There are restrictions on the free version of the software.
Features:

  • Supports symmetric multiprocessing (SMP)
  • Stores data logically in the form of tablespaces and physically in the form of datafiles
  • Transportable tablespaces
  • Advanced Queuing (AQ)
  • 64-bit database
  • Data Mining Option
Code license: Closed source
Last updated: 22 Mar 2015

TiddlyWiki is a reusable personal web notebook. It allows anyone to create personal hypertext documents that can be published on the Web, and also search and tag content. The developers write, "TiddlyWiki is designed to be non-linear, structuring content with stories, tags, hyperlinks, and other features. You can organise and retrieve your notes in ways that conform to your personal thought patterns, rather than feel chained to one preset organisational structure. You can use TiddlyWiki as a single file that you view and edit through any web browser, whether you are online or offline.

Code license: Open source, BSD
Last updated: 22 Mar 2015

A French-developed Java application that displays the lexical relations of a word in a 3D environment.

Last updated: 22 Mar 2015

Freedity can create an RSS feed from any web page, with the number of feeds and update interval varying based on the tier of the subscription.

Last updated: 5 Mar 2015

VARD 2 is an interactive piece of software produced in Java designed to assist users of historical corpora in dealing with spelling variation, particularly in Early Modern English texts. The tool is intended to be a pre-processor to other corpus linguistic methods such as keyword analysis, collocations and annotation (e.g. POS and semantic tagging), the aim being to improve the accuracy of these tools

Last updated: 19 Feb 2015

CorpusSearch 2 allows users to construct and search syntactically annotated corpora, including finding and counting lexical and syntactic patterns, correcting systemic errors, and coding linguistic features.

The software is released under Mozilla Public License 1.1 (MPL 1.1) .

Code license: Open source
Last updated: 11 Feb 2015

A software tool for performing concordance – the analysis of a set of words within its immediate context - on a body of text. The tool performs full concordance, reading and analysing each and every word in a text. It was initially written for the analysis of English texts, but has since been extended to cater for other Western languages. Limited support is also provided for text in East Asian scripts, such as Chinese and Korean.

Features:

Code license: Closed source
Last updated: 11 Feb 2015

AntConc is free concordance software. It is multi-platform and easy to deploy and use.

AntConc is part of a suite of related tools for text processing and analysis, including applications for parallel corpus analysis, word profiling, PDF to text conversion, text structure analysis, detecting and converting character encodings, Japanese and Chinese segmenter and tokenizer, wordclass tagger, and spelling variant anaysis. The developer is currently drafting a more explicit licence for the use of the software.

Last updated: 11 Feb 2015

WriteLaTeX is a free service that lets users create, edit and share their scientific ideas easily online using LaTeX, a comprehensive and powerful tool for scientific writing. Users can start projects with quality LaTeX templates for journals, CVs, resumes, papers, presentations, assignments, letters, project reports, and more.

Code license: Closed source
Last updated: 30 Jan 2015

CATMA (Computer Aided Textual Markup & Analysis) is a free, open source markup and analysis tool from the University of Hamburg's Department of Languages, Literature and Media. It incorporates three interactive modules: (1) The tagger enables flexible and individual textual markup and markup editing. (2) The analyzer incorporates a query language and predefined functions. It also includes a query builder that allows users to construct queries from combinations of pre-defined questions while allowing for manual modification for more specific questions.

Code license: GNU GPL v3
Last updated: 29 Dec 2014

960 Grid System is a CSS template that comes with corresponding Acorn, Fireworks, Flash, InDesign, GIMP, Inkscape, Illustrator, OmniGraffle, Photoshop, QuarkXPress, Visio, Exp Design, and printable templates to facilitate different stages of the web design process.

Code license: Open source, GNU GPL, MIT License
Last updated: 29 Dec 2014

A simple word cloud generator with customizable font and color options. Word clouds are generated by pasting text into a box, or by entering the URL of any blog, blog feed, or any other web page that has an Atom or RSS feed.

Code license: Closed source
Last updated: 29 Dec 2014

MONK is a digital environment designed to help humanities scholars discover and analyze patterns in the texts they study.

Last updated: 29 Dec 2014

The Visual Understanding Environment (VUE) is concept mapping software that can integrate with multiple repositories to pull in, organize, and analyze data. Multiple features for advanced management of digital resources for teaching, learning, and research.

Last updated: 29 Dec 2014

Integrated Content Environment (ICE) was an open source project of the Learning Resources Development (LRD) unit at the University of Southern Queensland. The content management system allowed users to convert content authored in Microsoft Word or OpenOffice.org Writer into self-contained course websites using the IMS format.

The ICE authoring environment enabled:

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Calibre is a free and open source ebook library management application, including options for syncing to devices and converting between a large number of formats. Calibre also has a built-in e-book editor for EPUB and AZW3 formats.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 29 Dec 2014

QuarkXPress desktop publishing software is commonly used to create page layouts for a variety of print publications such as books, newspapers, magazines, posters and brochures. Similar in function to InDesign, the main differences are Quark's unique features for exporting documents as interactive webpages as well as its widespread use by printers, typesetters and page designers.
Features:

Code license: Closed source
Last updated: 29 Dec 2014

The main programs that comprise the Information processor are called the analyst server and query or knowledge processor. The analyst program can be called from a command line, from an html form, or through a TCP/IP socket protocol. The query processor can be accessed with any browser using HTML commands. It analyzes text and allows the user to search it.

Code license: Closed source
Last updated: 29 Dec 2014

Exhibit 3.0 is a publishing framework for large scale data-rich interactive Web pages. The beta version is scalable up to 100k items.

Last updated: 29 Dec 2014

Blogger is simple blog publishing software owned by Google.

Code license: Closed source
Last updated: 29 Dec 2014

"The Virtual Lightbox for Museums and Archives (VLMA) is an educational tool for collecting and reusing in a structured fashion the online contents of museums and archives with visual components. With VLMA, you can browse and search collections, construct personal collections, export these collections to xml or Impress presentation format, annotate them, and share your collections with other VLMA users."

Code license: Open source
Last updated: 29 Dec 2014

A text editor designed for use by software developers and web designers to edit, search, and manipulate text. BBEdit provides native support for several programming and scripting languages. Third party custom modules are available, created by users, to handle languages that are not supported in the native application.

Features:

Code license: Closed source
Last updated: 29 Dec 2014

CHET-C, or Chapel Hill Electronic Text-Converter, is a browser based software tool designed to convert digital texts that employ standard epigraphic conventions such as the Leiden sigla into EpiDoc-compliant XML files.

The tool can be accessed online at http://www.stoa.org/projects/epidoc/stable/chetc-js/chetc.html. Fragments of epigraphic text using standard sigla (eg Leiden convention markup) are pasted into the tool and Epidoc compliant XML is generated.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Fedora (Flexible Extensible Digital Object Repository Architecture) was originally developed by researchers at Cornell University as an architecture to store, manage, and access digital content in the form of digital objects. Fedora defines a set of abstractions for expressing digital objects, asserting relationships among digital objects, and linking behaviors to digital objects.

Code license: Open source, Apache License
Last updated: 29 Dec 2014

MLA, APA, Chicago / Turabian and most-common Bluebook forms as an integrated citing and note-taking platform for individual or group projects. Prompts for analysis of source types and is unique in offering teaching support and personal help on any citation. Instructor / librarian view allows teacher to comment on work-in-progress providing just-in-time feedback in-context. Archives copies of web pages and pdfs which can be annotated. Dashboard provides long-term access to a portfolio of work.

Code license: Closed source
Last updated: 29 Dec 2014

MediaWiki is a free software open source wiki package written in PHP, originally for use on Wikipedia and other Wikimedia Foundation projects. It is designed to be run on a large server farm for a website that gets millions of hits per day.

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 29 Dec 2014

WriteRoom is an alternative to Microsoft Word, that removes distractions on your computer while you're writing. WriteRoom is a full screen writing environment that has certain functions like word count and autosave. WriteRoom for iOS is synced with Dropbox, and your iPhone/iPad/iPod touch.

Code license: Closed source
Last updated: 29 Dec 2014

Journler is a daily notebook and entry based information manager. Scholars, teachers, students, writers, and everyday users may use this on a daily basis to integrate their notebook content to other sources of media such as audio and video.

The site has not been updated since 201. It looks like Journaler is now available open source though the option to purchase is still displayed.

Code license: Open source
Last updated: 29 Dec 2014

Co-ment is a text annotation and collaborative writing tool. Co-ment provides a friendly graphic user interface for text annotation, collaboration and writing texts online.

Code license: GNU Affero GPL v.3
Last updated: 29 Dec 2014

eLaborate is an online work environment in which scholars can upload scans, transcribe and annotate text, and publish the results as on online text edition which is freely available to all users.

Code license: GNU GPL v3
Last updated: 29 Dec 2014

Pliny is a scholarly note-taking and annotation tool. It may be used with both digital (web pages, images, PDF files) and non-digital (books, printed articles) materials, run as a desktop application on the user's computer. Pliny is useful for taking and managing annotations and notes while reading, as well as subsequently developing and presenting an interpretation.

Last updated: 29 Dec 2014

Project Pad is web-based system for media annotation and collaboration for teaching and learning and scholarly applications. Project Pad provides tools for browsing and working with audio, video, and images from digital repositories. The user may organize and annotate excerpts within their own "online notebook." Available as a standalone web application or set of Sakai tools.

Code license: Open source, GPL
Last updated: 29 Dec 2014

The Annotator allows you to analyze any block of text created by other authors. You may use virtual markers to highlight important passages, questions, thoughts, or add comments.

Last updated: 29 Dec 2014

Jarnal is an open-source application for notetaking, sketching, keeping a journal, making a presentation, annotating a document - including pdf - or collaborating using a stylus, mouse or keyboard. It is similar to Microsoft Windows Journal and to the earlier Mimeo whiteboarding and Palm notepad applications.

Code license: GPL
Last updated: 29 Dec 2014

Mnemomap is a flash interactive search engine that generates a visual "Atomic-Tree", sends your queries to a Query List, and delivers the search results. The Atomic-Tree allows you to improve your query mid-search. The Query List allows you to customize your search query.

Last updated: 29 Dec 2014

Silobreaker is a search engine that aggregates the news from numerous sources and presents the contents in various visualization formats.

Last updated: 29 Dec 2014

Processing is an open source programming language and environment for people who want to create images, animations, and interactions. Initially developed to serve as a software sketchbook and to teach fundamentals of computer programming within a visual context, Processing also has evolved into a tool for generating finished professional work. Today, there are tens of thousands of students, artists, designers, researchers, and hobbyists who use Processing for learning, prototyping, and production.

Last updated: 29 Dec 2014

LATtice lets you explore and compare texts across entire corpora but also allows you to “drill down” to the level of individual LATs (language action types) to ask exactly what rhetorical categories make texts similar or different.

Last updated: 29 Dec 2014

TEI Boilerplate is a lightweight solution for publishing styled TEI (Text Encoding Initiative) P5 content directly in modern browsers. With TEI Boilerplate, TEI XML files can be served directly to the web without server-side processing or translation to HTML.

Last updated: 29 Dec 2014

A simple and easy tool for creating EPUB, MOBI, and other ebook formats.

Code license: Closed source
Last updated: 29 Dec 2014

Bookworm enables you to graphically explore lexical trends in repositories of digitized texts.

Code license: Open source
Last updated: 29 Dec 2014

Trello is a web-based project management and collaboration tool that allows users to organize projects in a dashboard view, containing one or more project-oriented boards. The dashboard provides a real-time overview of what is being worked on, who is working on what, and overall progress toward project milestones. Useful for organized task management, delegation, communication, and collaboration across teams.

Code license: Closed source
Last updated: 29 Dec 2014

Jekyll is a simple, blog aware, static site generator. It takes a template directory containing raw text files in various formats, runs it through Textile or Markdown and Liquid converters, and creates a complete, static ready-to-publish website suitable for serving with your favorite web server. Jekyll also happens to be the engine behind GitHub Pages, which means you can use Jekyll to host your project’s page, blog, or website from GitHub’s servers for free.

Code license: Open source, MIT License
Last updated: 29 Dec 2014

Pandoc can convert documents in reStructuredText, textile, HTML, or LaTeX formats to a variety of other formats including XHTML, PDF, EPUB, docx, odt, and more.

Code license: Open source
Last updated: 29 Dec 2014

Markdown is a text-to-HTML conversion tool for web writers. Markdown allows you to write using an easy-to-read, easy-to-write plain text format, then convert it to structurally valid XHTML (or HTML).

Code license: Open source, BSD
Last updated: 29 Dec 2014

A web application used to build and maintain an archetypal, invisible website format that combines text, image, movie and sound.

Last updated: 29 Dec 2014

DSpace is the software of choice for academic, non-profit, and commercial organizations building open digital repositories. It is free and easy to install "out of the box" and completely customizable to fit the needs of any organization.

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets. DSpace has an active community of developers and is used by thousands of institutions worldwide.

Last updated: 29 Dec 2014

WikiPack is a web based personal information organizer and Markdown editor that uses Dropbox for synced storage. Using plain text Markdown files and WikiWords, WikiPack gives information context and links entries together by turning your Markdown pages into a private, password protected wiki. The easy to use Markdown language lets you create and edit your wiki pages without having to learn complex wiki syntax.

Code license: Closed source
Last updated: 29 Dec 2014

Voyant Tools is a web-based reading and analysis environment for digital texts.

Code license: Open source
Last updated: 29 Dec 2014

Available as a web-based service and as an app for iOS, Mac, PC, and Android, Google Drive allows users to create, store, edit, and share files across all their devices. Online and offline file access available. Requires a Google account for use, but allows files from Drive to be shared with non-Google users.

Last updated: 1 Sep 2016

This online tool can be used for a wide variety of annotation tasks, including visualization and collaboration.

brat is designed in particular for structured annotation, where the notes are not freeform text but have a fixed form that can be automatically processed and "interpreted" by a computer. brat also supports the annotation of n-ary associations that can link together any number of other annotations participating in specific roles. brat also implements a number of features relying on natural language processing techniques to support human annotation efforts.

Last updated: 29 Dec 2014

Web-based discussion tool (not a full-fledged learning management system, but you can link to Piazza from your LMS, including Blackboard, Moodle, and Coursera) that allows student to ask questions and interact with instructors and other students in a public space. A wiki style format enables collaboration in a single space and features LaTeX editor, highlighted syntax and code blocking. Questions and posts needing immediate action are highlighted and instructors endorse answers to keep the class on track. Anonymous posting encourages every student to participate.

Code license: Closed source
Last updated: 29 Dec 2014

Korbo is a powerful aggregation platform for gathering Linked Data objects relevant to your area of research into single workspaces or “baskets”.

Korbo is targeted primarily at developers who want to build applications on top of its API and make full use of the linked cultural data from sources such as Europeana, FreeBase and DBPedia.

Korbo is currently in the early stages of development, but you can already try out a demo version of the platform.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Insync extends Google Drive's web functionality to your desktop by integrating with Windows, Mac and Linux platforms. Insync allows for built-in sharing without a browser, multiple account support, on-demand shared file syncing, desktop notifications and more.

Code license: Closed source
Last updated: 29 Dec 2014

A Web-based image annotation tool, built specifically for integration with existing Web pages or portal environments. Annotorious is also available as a plugin to the Annotator Web annotation system by the Open Knowledge Foundation.

Code license: MIT License
Last updated: 29 Dec 2014

Meld is a visual diff and merge tool targeted at developers. Meld helps you compare files, directories, and version controlled projects. It provides two- and three-way comparison of both files and directories, and has support for many popular version control systems.

Code license: Open source, GNU GPL v2
Last updated: 29 Dec 2014

Kaleidoscope is one of the world's best tools for spotting differences in images and text, and now it supports merging of files and folders, too. Kaleidoscope integrates directly with Git, Subversion, Mercurial, and Bazaar to fit perfectly in your workflow.

Last updated: 29 Dec 2014

The DocScanner app uses a device's built-in camera to scan documents. Features include image optimization, OCR, document type recognition (document, business card, receipt, etc.), autosorting, and ability to upload documents to Evernote, Dropbox, and Google Drive.

Code license: Closed source
Last updated: 29 Dec 2014

nanoc is a Ruby-based, "static site generator" --it works as a tool that runs on your local computer and compiles documents written in formats such as Markdown, Textile, Haml… into a static web site consisting of simple HTML files, ready for uploading to any web server.

Code license: MIT License
Last updated: 29 Dec 2014

Project management software for sharing files, messages, and task management, including options for daily update emails, and real time document editing.

Code license: Closed source
Last updated: 29 Dec 2014

Participad is a WordPress plugin that allows multiple people to edit the same WP content at the same time. Powered by Etherpad Lite, Participad gives you: notepads for collaborative notetaking; synchronous authoring of any content in the WordPress Dashboard; front-end editing. You can download it from the WordPress plugin repository.

Participad has three modules:

Code license: Open source, GNU GPL v3
Last updated: 29 Dec 2014

LitBlitz is free beta Chrome extension that aims to improve how students and researchers manage their notes for literature reviews, assignment research and more by simplifying pdf management, allowing capture and annotation of document snippets


LitBlitz v1.0 is currently available as a Google Chrome extension.

LitBlitz, while still available on the Google Chrome store no longer appears to be under development, and the company url redirects to a Japanese language web page.

Last updated: 29 Dec 2014

Digitate is a free application designed for use on the iOS platform, specifically on iPad devices. The application allows scholars and enthusiasts with an interest in the visual and material elements of a cultural artefact to make notes and annotations directly on an image of such an artefact.

For example, a literary scholar might use it to annotate the material or bibliographic elements of a rare text or first edition, while an art historian might do the same on an image of a painting.

Code license: Open source, Creative Commons
Last updated: 29 Dec 2014

Nomenklatura is a reference data recon server. It is a service that allows users to define and manage manage lists of canonical entities (e.g. person or organization names) and aliases that connect to one of the canonical entities. This helps to clean up messy data in which a single entity may be referred to by many names.It includes a user interface, an API, and a reconciliation endpoint for OpenRefine for matching data from data sets with the canonical entries.

Code license: Open source
Last updated: 29 Dec 2014

From the website: NodeXL is a free, open-source template for Microsoft® Excel® 2007 and 2010 that makes it easy to explore network graphs. With NodeXL, you can enter a network edge list in a worksheet, click a button and see your graph, all in the familiar environment of the Excel window. (http://nodexl.codeplex.com/)

Last updated: 29 Dec 2014

NodeBox is an application for creating 2D graphics and visualizations. It provides a visual and process-based editor for an underlying Python-based analysis and visualisation package. It is developer-described as a generative design app and this really taps into the serendipitous nature of the environment. The user constructs models and can tweak them in real time via the interface and see the resulting changes too the output.
It has been described as being "similar to Processing, but without all the interactivity".

Last updated: 29 Dec 2014

Writefull is a light-weight app that uses data from Google Books (5+ million books) and the Web to improve your writing, It compares small sections of your text to a large data set of writing found online and in Google Books. All you need to do is select a chunk of your text in your browser or text editing software, activate the Writefull popover, and choose one of its five options:

1) check the number of results (how often the chunk appears in Google Books or the Web);

Code license: Closed source
Last updated: 29 Dec 2014

Annotation Studio is an open source, web-based annotation application that integrates a powerful set of textual interpretation tools behind an intuitive and easy-to-use interface. Users can upload their own texts, and annotate with styled text, video, images, and weblinks. To date, the project has been used with great success in disciplines such as Writing, Literature, Foreign Languages, Anthropology, Film and Media Studies, and others at institutions including Harvard, Yale, Stanford, MIT, Barnard College, and Washington University.

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 29 Dec 2014

NowComment makes it easy to have rich, engaging discussions of online documents no matter how large (or small) your class or collaboration group. It's fast, powerful, and feature-rich: you can sort comments, skim summaries, create assignments, hide comments, highlight with multiple colors and meanings, and much more. Integrates to any LMS via LTI. Used in universities and K12 schools for the past 6 years.

Code license: Closed source
Last updated: 29 Dec 2014

BLLIP Parser (or Charniak-Johnson parser) is a statistical natural language parser for analyzing text to determine its grammatical structure. Grammatical structures are provided in Penn Treebank format.

Code license: Apache License
Last updated: 29 Dec 2014

Umigon is a free tool for sentiment analysis on Twitter.

Main features:

  1. Export to Excel and csv
  2. Distinction between sentiments ("I hate war", will be classified as negative sentiment) and negative factuals ("war has been declared", will be declared as neutral)
  3. Connects to twitter or allows free text input



The developer of Umigon can be reached on Twitter.

Code license: Apache License
Last updated: 29 Dec 2014

Annotating documents with highlights and notes can quickly clutter the page. Annotations simplifies adding and managing notes to texts while keeping the documents clear and readable.

Features

  • Highlight text with colours, assign custom keywords or add notes
  • Auto-completion to match existing keywords as you type
  • Organise and filter annotations by collections, type, keywords or matching search criteria
  • Create relationships between different annotations
Last updated: 29 Dec 2014

Ghost is a free, open source publishing platform. Also available as a hosted service for a monthly subscription cost.

Code license: Open source, MIT License
Last updated: 29 Dec 2014
CSV
Subscribe to Text