Content Analysis

What kind of data should the tool work with?

Textable is an open source program for text analysis. It offers a set of basic text-analytic components (e.g. import text from files, segment into words, measure segment diversity, etc.), which the user combines using a visual interface to build custom analytic workflows.

Code license: GNU GPL v3
Last updated: 20 Aug 2017

Gephi software de gráficos que proporciona una manera de explorar datos a través de la visualización y análisis de redes.

Code license: Open source, GNU GPL v3
Last updated: 15 Feb 2017

MyIndicators (http://myindicators.net/) is a digital, easy-to-use tool allows researchers, educators, students or anyone, to build their own tailored indicators (e.g. goals, strategies, parameters, survey, questions, calories intakes, alcohol consumptions or quantified self in terms of training, mood tracking or sleeping quality etc.)

Code license: Closed source
Last updated: 2 Sep 2016
Last updated: 23 Oct 2017

TXM

TXM es una multiplataforma de código abierto y libre basado en el software de análisis de texto Unicode, XML y TEI, y utiliza Windows, Mac OS X y Linux. Se encuentra también disponible como un software para portales compatibles J2EE (basados en GWT) para acceso en línea con control de acceso construido. (Para más información, consulte el portal de demostración: http://portal.textometrie.org/demo).

Code license: Open source, GNU GPL v3
Last updated: 29 Jun 2016

TAToo is an embeddable Flash widget that displays TAPOR analytics for the page on which it resides.

Code license: Apache License
Last updated: 23 Feb 2016

Philomine es una extensión para el motor de recuperación de texto Philologic que puede efectuar diferentes tareas para el aprendizaje por computadora, la minería de texto y la agrupación de documentos.

Code license: Open source, GNU GPL
Last updated: 22 Feb 2016

A graphical user interface tool for Latent Dirichlet Allocation topic modeling.

Last updated: 17 Feb 2016

Superfastmatch está diseñado para encontrar duplicados exactos de cadenas de texto entre documentos.

Code license: Open source, GNU GPL
Last updated: 1 Dec 2015

Unlock Text is a powerful geoparser that can search text hosted on the web in txt or html format for references to locations. These locations are then returned ready for use in your results page, web map or any other application.

The Unlock Text API provides access to two parsers, the Edinburgh Geoparser from the Edinburgh Language Technology Group and the CLAVIN parser.

Code license: Open source
Last updated: 19 Nov 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

Corpkit es una herramienta para llevar a cabo recopilación lingüística. Hace un montón de cosas usuales como análisis, concordancia y selección de palabras claves, pero además extiende su potencial de manera significativa: el usuario puede hacer concordancia a través de la búsqueda de combinaciones de características léxicas y gramaticales y puede hacer selección de palabras claves de lemas, de subcorpora comparado con corpora, o de palabras en ciertas posiciones dentro de las cláusulas.

Code license: MIT License
Last updated: 30 Oct 2015

NVivo es un software comercial que realiza el análisis cualitativo de data desestructurados, en una variedad de formatos y diversas fuentes. Permite que los usuarios recolecte, organice y analice el contenido de entrevistas, se focalice en grupos de discusión, encuestas, audios, medios sociales y sitios webs.

Code license: Closed source
Last updated: 30 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

Data Dictionary Generator está dirigido a la comunidad de edición TEI y tiene como objetivo ejecutarse dentro de oXygen. El diccionario Data Dictionary Generator (DDG) genera perfiles de cada uno de los elementos y atributos que aparecen en un archivo TEI. Cada entrada incluye una definición de las pautas de TEI, una representación, una definición específica del proyecto (si hubiere), un breve panorama de cómo se está utilizando realmente el elemento o atributo.

Last updated: 2 Oct 2015

Aimed at the TEI editing community and intended to be run inside oXygen, the Data Dictionary Generator (DDG) generates profiles of every element and attribute appearing in a TEI file. Each entry includes a definition from the TEI Guidelines, a local, project-specific definition (if provided), and a brief snapshot of how the element or attribute is actually being used. By making it easy to compare these three things, the DDG aims to help project editors reflect on current practice within their projects and quickly create stronger encoding guidelines for their collaborators.

Last updated: 28 Sep 2015

Nodegot es un entorno virtual basado en la gestión, análisis y visualización de información.
Al utilizar Nodegoat, el usuario puede definir, crear, actualizar, consultar y administrar un gran número de datos mediante el uso de una interfaz de usuario gráfica. Su modelo de datos personalizados autoconfigura el eje de las funcionalidades básicas de Notegoat.

Code license: Closed source
Last updated: 17 Aug 2015

Bibliopedia lleva a cabo técnicas avanzas de extracción de datos y referencias cruzadas de literatura académica para crear un colaboratorio centrado en humanidades. Como un prototipo, busca herramientas como JSTOR y la Bibilioteca del Congreso de Estados Unidos para encontrar metadatos acerca de artículos académicos y libros que mencionan las narrativas de viaje medievales más famosas . “The Travels of Sir John Mandeville” , analiza los artículos y libros para las citas, luego guarda los resultados en una base de datos de acceso para todo público.

Code license: Open source
Last updated: 2 Jul 2015

Este producto puede filtrar o brindar formato a contenido de texto. También incluye un organizador de enlaces y documentos y capacidades de búsqueda. Por esto, es posible que sea más apropiado denominarlo como un sistema de administración de textos. Si el usuario tiene una gran cantidad de documentos guardados en la computadora y enlaces en línea que usa, esta es una aplicación de utilidad que le permite navegar en el entorno con más facilidad.

Code license: GNU GPL v3
Last updated: 15 Jun 2015

Textpresso es un sistema de minería de texto para literatura científica. Los dos elementos principales de Textpresso son (1) el acceso al texto completo, de modo que se pueden hacer búsquedas en artículos enteros, y (2) el uso de categorías de conceptos y clasificaciones de la biología que denotan una relación con un objeto dado (por ejemplo, asociación, regulación, etc.) o que lo describen (por ejemplo, métodos, etc.).

Code license: Open source
Last updated: 28 May 2015

AnSWR permite realizar análisis cuantitativos de datos lingüísticos, gracias a un conjunto de métodos para organizar, mostrar, procesar, resumir e interpretar información.

Última actualización: 23/9/2005

Solo disponible para Windows 2000 y Windows XP.

Last updated: 24 May 2015

Weft QDA es una herramienta gratuita de código abierto para análisis de datos de textos. Permite importar documentos de formato de texto simple o PDF, aplicar notas a código del nivel de carácter, a categorías y a documentos, recuperar texto codificado, aplicar estadísticas de codificación sencillas, realizar búsquedas de texto libre y exportar a formatos HTML y CSV.

Last updated: 23 May 2015

HyperRESEARCH permite que los usuarios puedan codificar y recuperar, desarrollar teorías y realizar análisis de datos. El usuario puede trabajar con fuentes de texto, de gráficos, de audio o de video.

Last updated: 23 May 2015

Qualrus es una herramienta de análisis de información cualitativa e innovadora que ayuda a manejar datos no estructurados. Además, Qualrus aprende las tendencias de codificación del usuario, brinda una red de display semántica visual, aconseja a los usuarios y ofrece soporte técnico.

Last updated: 22 May 2015

El Analizador Macro-Etimológico (Macro-Etymological Analyzer, en inglés) es una aplicación web para el análisis de textos que busca todas las palabras de un texto dado en la red global etimológica (Etymological Wordnet) y genera estadísticas respecto de la etimología macro del texto, organizando las palabras según la raíz lingüística. Por ejemplo, puede analizar una novela y calcular las proporciones de palabras de origen anglosajón o afroasiático.

Code license: GNU GPL v3
Last updated: 20 May 2015

VassarStats es un sitio web que explica conceptos estadísticos y ofrece un ambiente basado en la web para hacer los cálculos. Las herramientas que incluye son: generadores de gráficos, generadores de distribución, procedimientos y pruebas t, y pruebas de correlación y regresión. Todas las herramientas operan con Java y se ejecutan desde el navegador.

Code license: Closed source
Last updated: 14 May 2015

AntWordProfiler es un software libre para el análisis de texto. En este caso analiza la frecuencia de palabras.

Last updated: 9 May 2015

Aplicación multiplataforma para el análisis de texto, video y hojas de cálculo (análisis cualitativo, cuantitativo y métodos mixtos de investigación)

Last updated: 2 May 2015

ANTHROPAC es un programa basado en menú DOS para recolectar y analizar datos de dominio cultural.
Recolecta y analizada data estructurada tanto cuantitativa como cualitativa. Ofrece herramientas analíticas y multi- variable.

Last updated: 2 May 2015

Leximancer es un software de análisis de texto que puede crear visualizaciones en base a red de conceptos y tópicos. También incluye análisis de sentimientos (análisis conocido como minería de opinión)

Last updated: 2 May 2015

ScraperWiki es una herramienta en línea para hacer lo que hace el proceso simple de scraping de datos y más colaborativo. Cualquiera puede escribir un raspador de pantalla usando el editor de línea. En la versión gratuita, el código y los datos se comparten en abierto. Debido a que es un wiki, otros programadores pueden contribuir y mejorar el código.

Code license: GPL
Last updated: 1 May 2015

Este paquete permite a los usuarios formar modelos de temas en MALLET y cargar los resultados directamente en R.

Code license: Open source, MIT License
Last updated: 25 Mar 2015

TAMS Analyzer es un programa que funciona con TAMS y permite asignar códigos etnográficos a fragmentos de un texto simplemente seleccionando el texto correspondiente y haciendo doble clic en el nombre del código de una lista. Una vez hecho esto, permite extraer, analizar y guardar la información codificada.

Code license: Open source, GNU GPL
Last updated: 24 Mar 2015

AntConc is free concordance software. It is multi-platform and easy to deploy and use.

AntConc is part of a suite of related tools for text processing and analysis, including applications for parallel corpus analysis, word profiling, PDF to text conversion, text structure analysis, detecting and converting character encodings, Japanese and Chinese segmenter and tokenizer, wordclass tagger, and spelling variant anaysis. The developer is currently drafting a more explicit licence for the use of the software.

Last updated: 11 Feb 2015

MONK is a digital environment designed to help humanities scholars discover and analyze patterns in the texts they study.

Last updated: 29 Dec 2014

The Visual Understanding Environment (VUE) is concept mapping software that can integrate with multiple repositories to pull in, organize, and analyze data. Multiple features for advanced management of digital resources for teaching, learning, and research.

Last updated: 29 Dec 2014

The main programs that comprise the Information processor are called the analyst server and query or knowledge processor. The analyst program can be called from a command line, from an html form, or through a TCP/IP socket protocol. The query processor can be accessed with any browser using HTML commands. It analyzes text and allows the user to search it.

Code license: Closed source
Last updated: 29 Dec 2014

Software for creating data dashboards. Many of the sample galleries portray corporate financial data.

Last updated: 29 Dec 2014

Pliny is a scholarly note-taking and annotation tool. It may be used with both digital (web pages, images, PDF files) and non-digital (books, printed articles) materials, run as a desktop application on the user's computer. Pliny is useful for taking and managing annotations and notes while reading, as well as subsequently developing and presenting an interpretation.

Last updated: 29 Dec 2014

Voyant Tools is a web-based reading and analysis environment for digital texts.

Code license: Open source
Last updated: 29 Dec 2014

Korbo is a powerful aggregation platform for gathering Linked Data objects relevant to your area of research into single workspaces or “baskets”.

Korbo is targeted primarily at developers who want to build applications on top of its API and make full use of the linked cultural data from sources such as Europeana, FreeBase and DBPedia.

Korbo is currently in the early stages of development, but you can already try out a demo version of the platform.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Umigon is a free tool for sentiment analysis on Twitter.

Main features:

  1. Export to Excel and csv
  2. Distinction between sentiments ("I hate war", will be classified as negative sentiment) and negative factuals ("war has been declared", will be declared as neutral)
  3. Connects to twitter or allows free text input



The developer of Umigon can be reached on Twitter.

Code license: Apache License
Last updated: 29 Dec 2014
CSV
Subscribe to Content Analysis