Data analysis

What kind of data should the tool work with?

Freebase "is an open, Creative Commons Attribution (aka CC-BY) licensed collection of structured data," and a "platform for accessing and manipulating that data" via API. Almost 40 million entities and assertions about those entities are stored within a graph database. The database was built by pulling in open data and relies on community contribution to stay updated. Freebase is part of the semantic web and emits Linked Open Data (via RDF) for all its entities.

Last updated: 15 Nov 2018

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 13 Oct 2018

Gephi software de gráficos que proporciona una manera de explorar datos a través de la visualización y análisis de redes.

Code license: Open source, GNU GPL v3
Last updated: 15 Feb 2017

ANNIS is an open source, cross platform (Linux, Mac, Windows), web browser-based search and visualization architecture for complex multi-layer linguistic corpora with diverse types of annotation. ANNIS, which stands for ANNotation of Information Structure, was originally designed to provide access to the data of the SFB 632 - “Information Structure: The Linguistic Means for Structuring Utterances, Sentences and Texts”. It has since then been extended to a large number of projects annotating a variety of phenomena.

Code license: Open source, Apache License
Last updated: 16 Sep 2016

Es un sistema de gestión de base de datos y plugins de estadística para Microsoft Excel 2007, 2010 y 2013. Posibilita trabajar con regresión lineal simple y múltiple, regresión polinómica y gráficos de dispersión etc.
El programa puede ser utilizado para generar visualizaciones y crear informes . Requiere tener instalado Microsoft Excel.

Code license: Closed source
Last updated: 15 Jul 2016

El paquete estadístico básico SPSS incluye asistencia para estadísticas descriptivas, estadísticas de dos variables, correlación, predicción de resultados numéricos y predicción para la identificación de grupos.

Last updated: 12 Jul 2016

TXM

TXM es una multiplataforma de código abierto y libre basado en el software de análisis de texto Unicode, XML y TEI, y utiliza Windows, Mac OS X y Linux. Se encuentra también disponible como un software para portales compatibles J2EE (basados en GWT) para acceso en línea con control de acceso construido. (Para más información, consulte el portal de demostración: http://portal.textometrie.org/demo).

Code license: Open source, GNU GPL v3
Last updated: 29 Jun 2016

ERDAS Imagine es una suite de programa de autoría de datos geo-espaciales. El programa posee un editor de gráficos de trama y un sensor remoto que efectúa análisis avanzados y modelado espacial para crear nueva información. ERDAS IMAGINE también sirve para visualizar resultados en 2D, 3D, vídeo y composiciones de mapas cartográficos de calidad. Está diseñado principalmente para procesamiento de tramas de datos y para la creación de imágenes digitales para mapeo en programas GIS o CAD.

Características:

Code license: Closed source
Last updated: 7 Jun 2016

GeoParser is a text analysis tool that may be used to identify and tag references to geographic location in a text resource using Natural Language Processing to analyse the composition of a resource and identifying words that match its geographic database. The approach is useful for processing names that may have one of several locations (e.g. Belfast in Ireland, New Zealand and Canada) and distinguishing names that may be confused with other common words (e.g. Reading in Berkshire and reading as an activity).

Last updated: 7 Jun 2016

OpendTect es un software usado para el análisis y visualización de datos sísmicos multi-nivel.

Características:

  • Visualización y análisis de datos en 2D y 3D en un sólo estudio
  • Rastreo de horizonte en 2D y 3D incluyendo auto-rastreo, plano por plano , rastreo manual y lineal
  • Cálculo y análisis en modalidad interactiva de programación( live coding) de varios atributos y filtros
  • Complemento de configuración
Code license: Open source, GNU GPL
Last updated: 7 Jun 2016

A statistical package that may be used to compare quantified assemblages of broken and incomplete objects, such as ceramics, glass and bones. Pie-Slice uses Estimated Vessel Equivalent (EVE) as a base form of measurement, in which each measurable fraction is scored as a fraction of a complete vessel. It also trials the use of a new statistical transformation - the pseudo-count transformation - which converts EVEs into Pottery Information Equivalents (PIEs). The latter enables assemblages to be compared using techniques such as log-linear and correspondence analyses.

Last updated: 7 Jun 2016

Now called TerraSurveyor, it is a software application for the transfer, assembly and enhancement of geophysical data obtained from gradiometers, resistivity meters and other monitoring instruments. With support for Geoplot, GSSI Profiler, Surfer (ASCII & binary) and Scintrex input formats

Last updated: 7 Jun 2016

Weave (Web-based Analysis and Visualization Environment, Entorno de análisis y visualización basado en la web) es una plataforma de visualización diseñada para que cualquier usuario pueda visualizar todos los datos disponibles para cualquier propósito. Weave es una plataforma de desarrollo de aplicaciones para varios niveles de competencia del usuario —desde novato hasta avanzado — y también permite integrar, diseminar y visualizar datos en niveles "anidados" de la geografía.

Last updated: 7 Jun 2016

Viewshare is a free web application for creating interfaces and visualizations of cultural heritage collections. It can create interactive maps, timelines, facets, tag clouds, histograms, and image galleries. The intended users of Viewshare are individuals managing and creating access to digital collections of cultural heritage materials. Viewshare is offered as a software as a service (SaaS), email ndiippaccess@loc.gov to request a free account.

Code license: Open source, MIT License
Last updated: 7 Jun 2016

The Science of Science (Sci2) Tool is a modular toolset supporting temporal, geospatial, topical, and network analysis and visualization of datasets at the micro (individual), meso (local), and macro (global) levels. Users of the tool can:

Code license: Open source
Last updated: 1 Jun 2017

Easy-to-use web-based software for creating infographics and data visualization, including a platform to share your work and discover works by others.

Last updated: 7 Jun 2016

The DataTank is an open source tool that publishes data, stored in text-based files (e.g., CSV, XML, JSON) or in binary structures (e.g., SHP files, relational databases). The DataTank reads data from these structures and publishes them to the web using a URI as an identifier, providing these data in any format a user wants regardless of the original data structure. The DataTank requires a server with Apache2 or Nginx, mod rewrite enabled, PHP 5.4 or higher, Git, any database supported by Laravel 4.

Features

Last updated: 7 Jun 2016

Quadrigram describe un "ambiente de programación visual" para datos activos. Es una herramienta para la visualización de datos basada en la web que permite a los usuarios personalizar y publicar visualizaciones a partir de una serie de tipos de datos. Las posibilidades de visualización van desde tablas y gráficos básicos (por ejemplo, gráfico de torta, gráfico de barras), a visualizaciones más sofisticadas para explorar set de datos complejos (por ejemplo, redes, datos geográficos, mapas de árbol con función para ampliar, cuadrificación, flujo acumulado).

Code license: Closed source
Last updated: 22 May 2016

TokenX es un entorno web para visualizar , analizar y practicar con piezas de textos. Las opciones que permite realizar son entre otras: nubes de tags, resaltar palabras, palabras claves emergentes desde su contexto , desarrollar un recuento de palabras teniendo en cuenta su contexto o sin él, sustituir palabras y destacar puntuaciones o caracteres no conocidos.
El programa ofrece distintos archivos como modelos , o los usuarios pueden redirigir TokenX hacia un archivo XML online.

Last updated: 19 Apr 2016

Publish or Perish is a software program that retrieves and analyzes academic citations. It uses Google Scholar to obtain the raw citations, then analyzes these and presents the statistics.

Last updated: 24 Feb 2016

The TAPoR Portal is an online environment where users can keep track of texts they want to study (uploaded or available online), learn about and try different tools, and run tools on texts.

Last updated: 23 Feb 2016

A graphical user interface tool for Latent Dirichlet Allocation topic modeling.

Last updated: 17 Feb 2016

Exploratree (árbol de exploración) es un catálogo web y una aplicación para editar "guías interactivas de pensamiento", que son plantillas útiles para el mapeo de la mente, de intercambio de ideas, la planificación, y su visualización. Fue originalmente desarrollada para su uso en el aula, para ayudar a los estudiantes a refinar y enfocar sus ideas, así como gestionar los planes de investigación. Las "guías de pensamiento" se pueden editar, imprimir y descargar directamente desde el navegador.

Last updated: 29 Dec 2015

TwapperKeeper is now called Hootsuite Archives and can be accessed from within Hootsuite.

Code license: Closed source
Last updated: 13 Dec 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

SwiftRiver es un software de código abierto en línea para aplicar filtros en tiempo real, realizar tratamiento y análisis cualitativos de datos de redes sociales (Twitter, entre otros).

Code license: Open source, GNU GPL
Last updated: 3 Nov 2015

Voyeur es un entonro de análisis de texto basado en la web en el cual los usuarios pueden aplicar una amplia variedad de herramientas a cualquier texto que importen.

Last updated: 3 Nov 2015

Mapline (previously Topo.ly) is a free and paid online service for capturing and geocoding spatial data from spreadsheets and creating point, territory and heat maps. It is free for limited use (quite generous) and paid when you need to map significant (we are talking substantial) datasets. It's intuitive, easy to use and produces high quality interactive maps. Free service has only minimal map customization options and does not include the visual analysis that is included with the fee options.

Code license: Closed source
Last updated: 6 Oct 2015

Dataplot es un software de dominio público y gratuito para el análisis estadístico y el modelado no lineal. Fue desarrollado por el Insistuto Nacional de Estándares y Tecnología de los Estados Unidos. Realiza "análisis científico, matemático y gráfico, así como de ingeniería y de estadística" mediante el uso de "un lenguaje de comandos y un sistema interactivo con sintaxis símil-Inglés". Funcionará en Unix, Linux, Mac OS X y Windows XP / VISTA / 7.

Code license: Open source
Last updated: 13 Aug 2015

El programa MONK workbench provee 525 obras de la Literatura de América del siglo XVIII y XIX y 37 obras de teatro y 5 obras de poesía escritas por William Shakespeare, junto con herramientas que permiten la investigación literaria a través del descubrimiento, el análisis y la visualización de patrones.

Last updated: 12 Aug 2015

Philologic se encarga de la búsqueda de textos integrales, y de la recuperación y del análisis de herramientas que pueden utilizarse con programas como TEI-Lite XML/SGML, Unicode, plaintext, Dublin Core/HTML y DocBook.

Code license: GNU GPL, Open source
Last updated: 9 Aug 2015

VisualEyes es una herramienta web de autoría desarrollada en la Universidad de Virginia para unir imágenes, mapas, gráficos, vídeo y datos en visualizaciones dinámicas altamente interactivas y atractivas.

Code license: Open source
Last updated: 3 Aug 2015

RStudio es un entorno de desarrollo integrado (IDE, según las siglas en inglés) para R. Está disponible tanto en la versión de código abierto como en la versión para usuarios finales, y se puede operar desde el escritorio o desde un navegador conectado al servidor de RStudio. Las funciones que incluye son subrayado de sintaxis, ejecución de código, sangría inteligente y depurador interactivo.

Code license: Open source
Last updated: 14 Jul 2015

Microsoft Excel es un programa que utiliza una planilla con cálculos, herramientas de gráficos y opciones de tabla dinámica para analizar datos. Existe una versión alojada en la nube como parte Office 365.

Code license: Closed source
Last updated: 13 Jul 2015

TimeRime es una herramienta basada en la web que permite crear, visualizar y comparar líneas de tiempo interactivas.

Code license: Closed source
Last updated: 8 Jul 2015

Bibliopedia lleva a cabo técnicas avanzas de extracción de datos y referencias cruzadas de literatura académica para crear un colaboratorio centrado en humanidades. Como un prototipo, busca herramientas como JSTOR y la Bibilioteca del Congreso de Estados Unidos para encontrar metadatos acerca de artículos académicos y libros que mencionan las narrativas de viaje medievales más famosas . “The Travels of Sir John Mandeville” , analiza los artículos y libros para las citas, luego guarda los resultados en una base de datos de acceso para todo público.

Code license: Open source
Last updated: 2 Jul 2015

Programa de análisis de texto bajo estadística de lenguaje natural cuyo objetivo es determinar la estructura gramatical de los textos en cuestión.

Code license: GNU GPL, Open source
Last updated: 18 Jun 2015

140kit proporciona una capa de administración para la recolección y análisis de tuits.

Los datos sin procesar no se pueden enviar a los usuarios, pero 140kit permite ejecutar un proceso analítico en todo el conjunto de datos y guardarlos por un período deseado. Cuando se crean nuevos procesos analíticos, pueden ejecutarse en conjuntos de datos existentes. 140kit no solicita el control del análisis, pero retiene la propiedad de los datos recolectados.

Last updated: 24 May 2015

Event Structure Analysis fue desarrollado en la Universidad de Indiana y consiste en tres componentes: Ethno, análisis de requisitos previos y análisis de composición. Ethno es un programa en línea de Java que permite analizar eventos secuenciales; el análisis de requisitos previos genera un diagrama que muestra la conexión de los eventos; y el análisis de composición muestra el agente, la acción, el objeto del código, y otras características de cada suceso.

Last updated: 24 May 2015

Dispute Finder es un complemento de Firefox que permite añadir etiquetas de "controversial" a texto de sitios web y visualizar partes de texto que otros hayan etiquetado.

Last updated: 24 May 2015

AnSWR permite realizar análisis cuantitativos de datos lingüísticos, gracias a un conjunto de métodos para organizar, mostrar, procesar, resumir e interpretar información.

Última actualización: 23/9/2005

Solo disponible para Windows 2000 y Windows XP.

Last updated: 24 May 2015

Realiza búsquedas que se correlacionan con datos reales: Google Correlate encuentra patrones de búsqueda que se corresponden con tendencias reales.

Last updated: 24 May 2015

GRETL () es un paquete de software multiplataforma para análisis econométrico en C. Algunas de sus características son:

Code license: Open source, GNU Affero GPL
Last updated: 23 May 2015

Weft QDA es una herramienta gratuita de código abierto para análisis de datos de textos. Permite importar documentos de formato de texto simple o PDF, aplicar notas a código del nivel de carácter, a categorías y a documentos, recuperar texto codificado, aplicar estadísticas de codificación sencillas, realizar búsquedas de texto libre y exportar a formatos HTML y CSV.

Last updated: 23 May 2015

HyperRESEARCH permite que los usuarios puedan codificar y recuperar, desarrollar teorías y realizar análisis de datos. El usuario puede trabajar con fuentes de texto, de gráficos, de audio o de video.

Last updated: 23 May 2015

Qualrus es una herramienta de análisis de información cualitativa e innovadora que ayuda a manejar datos no estructurados. Además, Qualrus aprende las tendencias de codificación del usuario, brinda una red de display semántica visual, aconseja a los usuarios y ofrece soporte técnico.

Last updated: 22 May 2015

Silk es una plataforma para sitios que realizan recopilación de información. Es como Tumble pero para sitios que tienen un contenido estructurado, como revisión de software, información sobre diseñadores, un sitio con una base de datos de la ONU y mucho más. &#13

Last updated: 22 May 2015

El entorno de enlace texto-imagen (TILE, según las siglas en innglés) es una herramienta basada en la web que permite crear y editar ediciones electrónicas basadas en imágenes y archivos digitales de textos de las humanidades. Permite al usuario importar y exportar líneas e imágenes de texto transcritas, así como marcar la imagen, e incluye un reconocedor de oraciones semi-automático.

Last updated: 18 May 2015

Minitab ofrece herramientas para la visualización y el análisis estadístico. Incluye herramientas para la creación de gráficos, y para el trabajo con varianza, regresión, fiabilidad, tamaño de la muestra, series temporales, previsión, ensayo de equivalencia, tablas, simulaciones y distribuciones.

Code license: Closed source
Last updated: 18 May 2015

MicrOsiris es un paquete estadístico y de gestión de datos para Windows. Este producto gratuito se deriva de OSIRIS IV, un paquete estadístico y de gestión de datos desarrollado por la Universidad de Michigan. Puede importar más de 10.000 variables de SPSS, SAS, STATA, UNESCO IDAMS y Excel. Se distribuye como un programa gratuito.

Last updated: 18 May 2015

Lexos es una herramienta en línea que permite al usuario "restregar" (limpiar) los textos, cortar fragmentos en diferentes tamaños, manejar los fragmentos y conjuntos de fragmentos, y elegir a partir de una gama de herramientas de análisis para investigar estos textos.Sus funciones incluyen la construcción de dendogramas, la realización de gráficos sobre promedios móviles de frecuencias de palabras o proporciones de palabras o letras, y el juego con las visualizaciones de las frecuencias de palabras, como nubes de palabras y visualización en burbujas.

Code license: Open source
Last updated: 17 May 2015

Statistical Labes es una interfaz de usuario gráfica diseñada para hacer que el análisis estadístico sea más fácil de entender. Esta herramienta interactiva conecta marcos de datos, tablas de frecuencia, números aleatorios o matrices, y los despliega. Statistical Lab opera con R para hacer cálculos, generar análisis y desarrollar múltiples simulaciones y manipulaciones.

Code license: GPL
Last updated: 17 May 2015

Project Quincy permite a los usuarios rastrear el desarrollo de las instituciones y redes sociales en el tiempo y el espacio usando información de personas, lugares e instituciones. Es una aplicación Django con una base de datos MySQL que puede instalarse en un servidor web.

Code license: Open source, GNU GPL
Last updated: 17 May 2015

SAS Analytics es un entorno para la modelización predictiva y descriptiva, la minería de datos, la estadística textual, la predicción, la optimización, la simulación, el diseño experimental y para llevar a cabo otras operaciones estadísticas.

Last updated: 16 May 2015

El Sample Size Calculator es una herramienta en línea fácil de usar para calcular el tamaño de la muestra de acuerdo con diferentes variables.

Last updated: 16 May 2015

VassarStats es un sitio web que explica conceptos estadísticos y ofrece un ambiente basado en la web para hacer los cálculos. Las herramientas que incluye son: generadores de gráficos, generadores de distribución, procedimientos y pruebas t, y pruebas de correlación y regresión. Todas las herramientas operan con Java y se ejecutan desde el navegador.

Code license: Closed source
Last updated: 14 May 2015

RSiena es un paquete para lenguaje en R que habilita el análisis estadístico de datos de red, lo que incluye datos longitudinales y transversales de la red y datos longitudinales de la red y su comportamiento. Brinda la misma funcionalidad que el software SIENA (Simulation Investigation for Empirical Network Analysis) de Windows, que ya no se actualiza.

Code license: Open source, GNU GPL v2
Last updated: 13 May 2015

StatCrunch es un software de análisis estadístico y de uso compartido de datos.

Last updated: 9 May 2015

HUBzero es una plataforma web de publicación y gestión de contenidos diseñado para facilitar la colaboración en áreas de investigación y aprendizaje. Además de las funciones de blog y de discusión estándar, los rasgos más distintivos de HUBzero son el de ofrecer un entorno integrado que permite ejecutar software interactivos desarrollados dentro del navegador, sumado a un área de desarrollo de herramientas y la capacidad de compartir datos y documentos de forma privada entre los miembros de la red.

Code license: Open source
Last updated: 9 May 2015

bubbl.us es una herramienta de mapeo mental basada en la web, útil para organización e intercambio de ideas, y para el análisis y visualización de datos. Con una interfaz simple su funcionamiento básico es de fácil comprensión. Se puede probar sin necesidad de crear una cuenta. Disponible también una aplicación en iOS para iPad.

Code license: Closed source
Last updated: 9 May 2015

Cytoscapees una plataforma para análisis, visualización y anotación de redes complejas.

Code license: GNU LGPL, Open source
Last updated: 8 May 2015

Graphviz es un programa de código abierto para la visualización de gráficos, que representa información estructural en forma de diagramas de redes y gráficos abstractos. El paquete incluye interfaces web e interfaces gráficas interactivas, y herramientas auxiliares, bibliotecas y lenguajes de programación adaptables.

Last updated: 7 May 2015

Aplicación multiplataforma para el análisis de texto, video y hojas de cálculo (análisis cualitativo, cuantitativo y métodos mixtos de investigación)

Last updated: 2 May 2015

Linguistic Inquiry and Word Count es un software de análisis de texto que calcula en qué medida ( "grados" ) las personas usan diferentes categorías de palabras en una determinada selección de textos.

Last updated: 2 May 2015

ANTHROPAC es un programa basado en menú DOS para recolectar y analizar datos de dominio cultural.
Recolecta y analizada data estructurada tanto cuantitativa como cualitativa. Ofrece herramientas analíticas y multi- variable.

Last updated: 2 May 2015

Leximancer es un software de análisis de texto que puede crear visualizaciones en base a red de conceptos y tópicos. También incluye análisis de sentimientos (análisis conocido como minería de opinión)

Last updated: 2 May 2015

Netvibes es un tablero web personal y gratuito para seguir actualizaciones de estado y a amigos, y para usar las aplicaciones ofrecidas. La suscripción a la cuenta premium incluye funciones adicionales como estadísticas, etiquetado, preservación de datos, alertas, análisis de estados de ánimo y búsqueda.

Last updated: 2 May 2015

PDFMiner es una herramienta de Python para extraer información de documentos PDF (no sólo texto, sino también información acerca de las fuentes, codificación y diseño).

Code license: MIT License
Last updated: 1 May 2015

OmniGraffle es una completa aplicación de diagramación y dibujo. Puedes crear wireframes, diagramas de flujo, diagramas de redes, mockups de interfaz de usuario, árboles genealógicos, diseños o planos de oficinas, etc ..
La actualización a OmniGraffle Pro añade soporte Visio, capas o layers compartidas, modo de presentación, los controles geométricos del objeto , AppleScript y soporte de Actions y más..

Code license: Closed source
Last updated: 6 Apr 2015

Rwui le permite convertir un guión R a una página web con una interfaz donde los usuarios pueden ejecutar el script incluso si no saben R.

Last updated: 3 Jan 2015

Data Desk implements traditional statistical techniques using a simple graphic display interface for data exploration. The program focuses specifically on the visual exploration of data.

Code license: Closed source
Last updated: 29 Dec 2014

MATLAB allows matrix manipulations, plotting of functions and data, implementation of algorithms, creation of user interfaces, and interfacing with programs written in other languages, including C, C++, Java, and Fortran.

Code license: Closed source
Last updated: 29 Dec 2014

CATMA (Computer Aided Textual Markup & Analysis) is a free, open source markup and analysis tool from the University of Hamburg's Department of Languages, Literature and Media. It incorporates three interactive modules: (1) The tagger enables flexible and individual textual markup and markup editing. (2) The analyzer incorporates a query language and predefined functions. It also includes a query builder that allows users to construct queries from combinations of pre-defined questions while allowing for manual modification for more specific questions.

Code license: GNU GPL v3
Last updated: 29 Dec 2014

SEASR provides an environment for developing data flows that ingest data, process it through a series of transformations and analytics, and send the data to a results viewer.

Last updated: 29 Dec 2014

A simple word cloud generator with customizable font and color options. Word clouds are generated by pasting text into a box, or by entering the URL of any blog, blog feed, or any other web page that has an Atom or RSS feed.

Code license: Closed source
Last updated: 29 Dec 2014

cue.language is a Java library that has tokenizing (words/sentences/ngram), string counting, language guessing, and stop word detection capabilities.

Code license: Apache License, Open source
Last updated: 29 Dec 2014

The Visual Understanding Environment (VUE) is concept mapping software that can integrate with multiple repositories to pull in, organize, and analyze data. Multiple features for advanced management of digital resources for teaching, learning, and research.

Last updated: 29 Dec 2014

HyperPo is a user-friendly text exploration and analysis program that allows users to import texts or use texts available online (in English or French), and provides frequency lists of characters, words and series of words, color-coding to indicate repetition, KWIC, co-occurrence and distribution lists, and the ability to simultaneously compare data from multiple texts.

Last updated: 29 Dec 2014

MALLET is a Java-based package for statistical natural language processing, document classification, clustering, topic modeling, information extraction, and other machine learning applications to text.

Code license: CPL, Open source
Last updated: 29 Dec 2014

text analytic and data extraction framework: data and semantic analytics in a suite of business applications.

Last updated: 29 Dec 2014

MAXQDA is a tool for qualitative data analysis, evaluation, and text analysis. You can export parts or all data into reports in Word, Excel, XML, or Images. The MAXQDA Multimedia Browser enables to code audio and video files directly without having to create a transcript. You can code your information however you like for easy retrieval and organization.

Code license: Closed source
Last updated: 29 Dec 2014

"In the WordHoard environment, texts are annotated or tagged by morphological, lexical, prosodic, and narratological criteria. They are mediated through a 'digital page' or user interface that lets scholarly but non-technical users explore the greatly increased query potential of textual data kept in such a form."

Code license: GNU GPL, Open source
Last updated: 29 Dec 2014

Software for creating data dashboards. Many of the sample galleries portray corporate financial data.

Last updated: 29 Dec 2014

A software application that enables relational databases to be created, managed and queried. The database management system enables multiple users to access a database through an appropriate interface. As an open source tool, MySQL underpins a number of free software projects, such as WordPress, phpBB and other software built on a LAMP infrastructure. Although widely used, there are a number of performance issues that limit its use in some environments. For example, it is unable to use multiple CPU cores to process a single query, potentially limiting its use as a data warehouse.

Code license: GNU GPL, Open source
Last updated: 29 Dec 2014

Pattern is a Python web mining module with tools for data retrieval (Google + Twitter + Wikipedia API, web spider, HTML DOM parser), text analysis (rule-based shallow parser, WordNet interface, syntactical + semantical n-gram search algorithm, tf-idf + cosine similarity + LSA metrics) and data visualization (graph networks).

Code license: BSD, Open source
Last updated: 29 Dec 2014

Processing is an open source programming language and environment for people who want to create images, animations, and interactions. Initially developed to serve as a software sketchbook and to teach fundamentals of computer programming within a visual context, Processing also has evolved into a tool for generating finished professional work. Today, there are tens of thousands of students, artists, designers, researchers, and hobbyists who use Processing for learning, prototyping, and production.

Last updated: 29 Dec 2014

Open source data visualization and analysis for novice and experts. Data mining through visual programming or Python scripting. Components for machine learning. Add-ons for bioinformatics and text mining. Packed with features for data analytics.

Last updated: 29 Dec 2014

Prism is a tool for crowdsourcing interpretation. Welcome to our experiment in crowd-sourcing and visualizing many readings of a common set of texts.

Last updated: 29 Dec 2014

ReDBox is a metadata registry application for describing research data.

Code license: Open source, GNU GPL v3
Last updated: 29 Dec 2014

An online text analysis tool that provides detailed statistics of your text, including features like the anlysis of words groups, finding out keyword density, analysing the prominence of word or expressions.

Last updated: 29 Dec 2014

Bookworm enables you to graphically explore lexical trends in repositories of digitized texts.

Code license: Open source
Last updated: 29 Dec 2014

The Durationator is a web-based tool which seeks to make the past usable one query at a time by providing legal information regarding the copyright term of any given cultural work.

Last updated: 29 Dec 2014

The Dataverse Network is an application to publish, share, reference, extract and analyze research data. It facilitates making data available to others, and allows to replicate others work. Researchers and data authors get credit, publishers and distributors get credit, affiliated institutions get credit.

Code license: Apache License, Open source
Last updated: 29 Dec 2014

GPS Visualizer is a free, easy-to-use online utility that creates maps and profiles from GPS data.

Last updated: 29 Dec 2014

This online tool can be used for a wide variety of annotation tasks, including visualization and collaboration.

brat is designed in particular for structured annotation, where the notes are not freeform text but have a fixed form that can be automatically processed and "interpreted" by a computer. brat also supports the annotation of n-ary associations that can link together any number of other annotations participating in specific roles. brat also implements a number of features relying on natural language processing techniques to support human annotation efforts.

Last updated: 29 Dec 2014

QDA Miner is an easy-to-use mixed-methods qualitative data analysis software package for coding, annotating, retrieving and analyzing small and large collections of documents and images. QDA Miner may be used to analyze interview or focus-group transcripts, legal documents, journal articles, even entire books, as well as drawing, photographs, paintings, and other types of visual documents.

Last updated: 29 Dec 2014

WordStat is a text analysis module for QDA Miner or SimStat. WordStat combines content analysis method by using dictionary approach and many algorithms exploration or various text mining methods. WordStat can apply existing categorization dictionaries to a new text corpus. It also may be used in the development and validation of new categorization dictionaries.

Last updated: 29 Dec 2014

The Observer XT is the professional and user-friendly event logging software for the collection, analysis, and presentation of observational data.

Last updated: 29 Dec 2014

The term "lexomics" was originally coined to describe the computer-assisted detection of "words" (short sequences of bases) in genomes. When applied to literature as we do here, lexomics is the analysis of the frequency, distribution, and arrangement of words in large-scale patterns. The current suite of lexomics tools are:

  • scrubber -- strips tags, removes stop words, applies lemma lists, and prepares texts for diviText
  • diviText -- cuts texts into chunks in one of three ways, count words, exports the results
Last updated: 29 Dec 2014

The purpose of ATLAS.ti is to help researchers uncover and systematically analyze complex phenomena hidden in text and multimedia data. The program provides tools that let the user locate, code, and annotate findings in primary data material, to weigh and evaluate their importance, and to visualize complex relations between them.

Last updated: 29 Dec 2014

Meld is a visual diff and merge tool targeted at developers. Meld helps you compare files, directories, and version controlled projects. It provides two- and three-way comparison of both files and directories, and has support for many popular version control systems.

Code license: Open source, GNU GPL v2
Last updated: 29 Dec 2014

Kaleidoscope is one of the world's best tools for spotting differences in images and text, and now it supports merging of files and folders, too. Kaleidoscope integrates directly with Git, Subversion, Mercurial, and Bazaar to fit perfectly in your workflow.

Last updated: 29 Dec 2014

The Tesserae project aims to provide a flexible and robust web interface for exploring intertextual parallels.

Last updated: 29 Dec 2014

Textexture is a tool for visualizing any text as a network. The resulting graph can be used to get a quick visual summary of the text, read the most relevant excerpts (by clicking on the nodes), and find similar texts.

Last updated: 29 Dec 2014

TVE is an interactive Java tool for exploring the effect of window size on three common linguistic measures: type-token ratio, proportion of hapax legomena, and average word length. In addition, TVE can cluster the text fragments according to a user-given set of words by applying principal component analysis (PCA).

Last updated: 29 Dec 2014

Circos is a software package for visualizing data and information. It visualizes data in a circular layout — this makes Circos ideal for exploring relationships between objects or positions. There are other reasons why a circular layout is advantageous, not the least being the fact that it is attractive.
Circos is ideal for creating publication-quality infographics and illustrations with a high data-to-ink ratio, richly layered data and pleasant symmetries. You have fine control each element in the figure to tailor its focus points and detail to your audience.

Code license: GPL
Last updated: 29 Dec 2014

LimeService is basically the hosted version of the GNU licensed LimeSurvey. It is a survey service-platform to prepare, run and evaluate on-line surveys. Besides basic free usage you are always getting the full feature set with no monthly fees or subscription plans.

I've used it before and found it to pretty robust.

Last updated: 29 Dec 2014

From the website: NodeXL is a free, open-source template for Microsoft® Excel® 2007 and 2010 that makes it easy to explore network graphs. With NodeXL, you can enter a network edge list in a worksheet, click a button and see your graph, all in the familiar environment of the Excel window. (http://nodexl.codeplex.com/)

Last updated: 29 Dec 2014

Ptolemaic is a computer application for music visualization and analysis written in the Java programming language. The software is designed to aid in the analysis of all types of Western music using established analytical techniques, including tonal functional analysis (Harrison 1994), pitch-class set analysis (Forte 1973), hierarchical linear analysis (Schenker 1935, Jones 2002), tonal pitch-space analysis on the Tonnetz (Riemann 1915), pitch-class set analysis (Forte 1973), and transformation analysis (Lewin 1987).

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

The Juxta family of software (Juxta, Juxta WS, and Juxta Commons) allows you to compare and collate versions of the same textual work. Juxta Commons is an online space powered by the open-source Juxta Web Service that lets you collate sets of two or more texts and share online visualizations of the differences between them.

Last updated: 29 Dec 2014

Statwing is an easy-to-use, web-based tool for data analysis and visualization. Upload data, select variables of interest, and Statwing automatically selects statistical tests and visualizations, then distills the results into plain English sentences (as well as traditional statistical output for those so inclined).

Free trial available, as well as multiple pricing plans:

Code license: Closed source
Last updated: 29 Dec 2014

NodeBox is an application for creating 2D graphics and visualizations. It provides a visual and process-based editor for an underlying Python-based analysis and visualisation package. It is developer-described as a generative design app and this really taps into the serendipitous nature of the environment. The user constructs models and can tweak them in real time via the interface and see the resulting changes too the output.
It has been described as being "similar to Processing, but without all the interactivity".

Last updated: 29 Dec 2014
CSV
Subscribe to Data analysis