Structural Analysis

What kind of data should the tool work with?

Textable is an open source program for text analysis. It offers a set of basic text-analytic components (e.g. import text from files, segment into words, measure segment diversity, etc.), which the user combines using a visual interface to build custom analytic workflows.

A number of ready-made recipes are made available on Textable's website to help users get started with the program. A complete list of features can be found there too.

Code license: GNU GPL v3
Last updated: 24 Mar 2017

Con DiscoverText, los usuarios pueden importar datos desde una amplia variedad de fuentes (como Facebook &amp, inicio de Twitter, texto simple, Word, Excel, comentarios públicos de YouTube, blogs o wikis, PDF, entre otros), codificarlos y generar nubes de palabras e informes.

Code license: Closed source
Last updated: 24 Feb 2017

This is a Windows program for generating and searching a KWIC concordance of a document ("KWIC" = "Keywords in Context"). A KWIC concordance is a list of the different words occurring in the document, with each instance of each word shown in context (that is, within a phrase). Word frequency is shown. Context size is user-definable, anything from 3 to 19 words long. The software acts on text files and on MS Word docx files, skipping over "stop" words. The concordance can be displayed alphabetically or by frequency, and can be written to a file.

Code license: Closed source
Last updated: 3 Feb 2017

TXM

TXM es una multiplataforma de código abierto y libre basado en el software de análisis de texto Unicode, XML y TEI, y utiliza Windows, Mac OS X y Linux. Se encuentra también disponible como un software para portales compatibles J2EE (basados en GWT) para acceso en línea con control de acceso construido. (Para más información, consulte el portal de demostración: http://portal.textometrie.org/demo).

Code license: Open source, GNU GPL v3
Last updated: 29 Jun 2016

IBM AeroText is an information extraction system for developing knowledge-based content analysis applications.

Last updated: 15 Jun 2016

Philomine es una extensión para el motor de recuperación de texto Philologic que puede efectuar diferentes tareas para el aprendizaje por computadora, la minería de texto y la agrupación de documentos.

Code license: Open source, GNU GPL
Last updated: 22 Feb 2016

yWorks is a powerful set of tools for creating diagrams using any number of frameworks. There are tools for working with HTML, FLEX, AJAX, Silverlight, Java and .NET.

yEd is also available from the yWorks site. This free graph editor can be used to create diagrams manually, or to import data for analysis.

Code license: Closed source
Last updated: 1 Dec 2015

Superfastmatch está diseñado para encontrar duplicados exactos de cadenas de texto entre documentos.

Code license: Open source, GNU GPL
Last updated: 1 Dec 2015

Sigma is a JavaScript library that allows for the deployment of a graph file. It makes it easy to publish networks on Web pages, and allows developers to integrate network exploration in rich Web applications.
It is highly interactive and allows a researcher to extend their work from a dedicated graph analysis package such as Gephi and share it via the web to allow for communication of research outputs, while permitting viewers to explore and discover their own findings from the raw graph network.

Code license: MIT License
Last updated: 14 Nov 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

Corpkit es una herramienta para llevar a cabo recopilación lingüística. Hace un montón de cosas usuales como análisis, concordancia y selección de palabras claves, pero además extiende su potencial de manera significativa: el usuario puede hacer concordancia a través de la búsqueda de combinaciones de características léxicas y gramaticales y puede hacer selección de palabras claves de lemas, de subcorpora comparado con corpora, o de palabras en ciertas posiciones dentro de las cláusulas.

Code license: MIT License
Last updated: 30 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

corpkit is a tool for doing corpus linguistics.

It does a lot of the usual things, like parsing, concordancing and keywording, but also extends their potential significantly: you can concordance by searching for combinations of lexical and grammatical features, and can do keywording of lemmas, of subcorpora compared to corpora, or of words in certain positions within clauses.

Corpus interrogations can be quickly edited and visualised in complex ways, or saved and loaded within projects, or exported to formats that can be handled by other tools.

Code license: MIT License
Last updated: 5 Oct 2015

SentimentBuilder is an online tool that performs text analytics on emails, reviews, feedback, chat data or any unstructured texts via Natural Language Processing. It's the only tool where you can upload a file for processing and then visually view the results in a Sankey Flow Report to quickly identify trends, issues and strengths and then customize each view, save and share! Export any result for your own offline analysis! Try the Always Free version today and upload your own data or try one of our sample files.

Code license: Closed source
Last updated: 4 Sep 2015

SylvaDB es un sistema de gestión de base de datos gráficos. Permite que aquellos usuarios que no poseen conocimiento alguno de la teoría de gráficos modelen, recopilen, consulten y analicen información en una estructura de red. SylvaDB provee herramientas para la creación de esquemas y modelos de manera fácil, la creación de formas automáticas para introducir datos, características colaborativas, un editor de consultas visual, búsquedas globales y locales, generación de informes gráficos, redes métricas y herramientas de visualización.

Code license: GNU Affero GPL v.3
Last updated: 9 Jun 2015

Whatizit puede adquirir hasta 500.000 términos que se copian en el cuadro de texto, para ejecutar cualquier operación de segmentación de análisis de texto predefinida.

Last updated: 23 May 2015

Diction analiza textos a nivel lingüístico para indicar rasgos como certeza, actividad, optimismo, realismo y frecuencia.

Last updated: 19 May 2015

VassarStats es un sitio web que explica conceptos estadísticos y ofrece un ambiente basado en la web para hacer los cálculos. Las herramientas que incluye son: generadores de gráficos, generadores de distribución, procedimientos y pruebas t, y pruebas de correlación y regresión. Todas las herramientas operan con Java y se ejecutan desde el navegador.

Code license: Closed source
Last updated: 14 May 2015

Lynks es una herramienta fácil de usar que se incorpora al navegador y se utiliza para crear redes. Lynks es una iniciativa del Centre for Innovation, perteneciente a la Universidad de Leiden University (Campus La Haya). El programa fue desarrollado en 2014 contó con la colaboración y experiencia del Dr. Eelke Heemskerk de la Universidad de Ámsterdam. El desarrollo del programa fue financiado con aportes del Fondo Europeo de Desarrollo Regional (EFRO, según las siglas en inglés) y la Municipalidad de La Haya.

Code license: Closed source
Last updated: 12 May 2015

Linguistic Inquiry and Word Count es un software de análisis de texto que calcula en qué medida ( "grados" ) las personas usan diferentes categorías de palabras en una determinada selección de textos.

Last updated: 2 May 2015

VennMaker ofrece una plataforma interactiva para compilar, generar, visualizar y analizar datos de relación.

Code license: Open source
Last updated: 22 Apr 2015

CollateX es un programa de Java para recolectar fuentes textuales, por ejemplo, para producir un texto crítico. A enero de 2012, el proyecto estaba en un estado de desarrollo incipiente y la documentación estaba incompleta.

Code license: GNU GPL v3
Last updated: 25 Mar 2015

Praat is software for the phonetic analysis of speech, including support for articulatory and speech synthesis.

Code license: GNU GPL v2
Last updated: 19 Feb 2015

CATMA (Computer Aided Textual Markup & Analysis) is a free, open source markup and analysis tool from the University of Hamburg's Department of Languages, Literature and Media. It incorporates three interactive modules: (1) The tagger enables flexible and individual textual markup and markup editing. (2) The analyzer incorporates a query language and predefined functions. It also includes a query builder that allows users to construct queries from combinations of pre-defined questions while allowing for manual modification for more specific questions.

Code license: GNU GPL v3
Last updated: 29 Dec 2014

MONK is a digital environment designed to help humanities scholars discover and analyze patterns in the texts they study.

Last updated: 29 Dec 2014

IBM InfoSphere is intended for enterprise-scale data warehouses, delivering access to structured and unstructured information and operational and transactional data.

Last updated: 29 Dec 2014

Korbo is a powerful aggregation platform for gathering Linked Data objects relevant to your area of research into single workspaces or “baskets”.

Korbo is targeted primarily at developers who want to build applications on top of its API and make full use of the linked cultural data from sources such as Europeana, FreeBase and DBPedia.

Korbo is currently in the early stages of development, but you can already try out a demo version of the platform.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Ptolemaic is a computer application for music visualization and analysis written in the Java programming language. The software is designed to aid in the analysis of all types of Western music using established analytical techniques, including tonal functional analysis (Harrison 1994), pitch-class set analysis (Forte 1973), hierarchical linear analysis (Schenker 1935, Jones 2002), tonal pitch-space analysis on the Tonnetz (Riemann 1915), pitch-class set analysis (Forte 1973), and transformation analysis (Lewin 1987).

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014
CSV
Subscribe to Structural Analysis