Gathering

What kind of data should the tool work with?

Textable is an open source program for text analysis. It offers a set of basic text-analytic components (e.g. import text from files, segment into words, measure segment diversity, etc.), which the user combines using a visual interface to build custom analytic workflows.

A number of ready-made recipes are made available on Textable's website to help users get started with the program. A complete list of features can be found there too.

Code license: GNU GPL v3
Last updated: 24 Mar 2017

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 10 Mar 2017

Con DiscoverText, los usuarios pueden importar datos desde una amplia variedad de fuentes (como Facebook &amp, inicio de Twitter, texto simple, Word, Excel, comentarios públicos de YouTube, blogs o wikis, PDF, entre otros), codificarlos y generar nubes de palabras e informes.

Code license: Closed source
Last updated: 24 Feb 2017

Yahoo Pipes allows users to combine, filter, translate, and geocode data from RSS feeds, JSON, KML, or other similar formats, and power widgets/badges using that data.

Last updated: 18 Jan 2017
Last updated: 2 Sep 2016

Jotform allows users to create web forms (for surveys, etc.) using a drag-and-drop interface.

Code license: Closed source
Last updated: 10 Aug 2016

ZeeMaps mapea rápidamente puntos sobre mapas de base Google de dos maneras:
1) El usuario sube un archivo .csv de puntos de datos y sus ubicaciones.
2) Un grupo de usuarios agrega sus propios puntos de ubicación en el mapa, en su tiempo libre de sus propios dispositivos.

Cada punto puede incluir texto, vídeo, imagen o anotaciones de audio.

La funcionalidad básica es gratuita; cargas más grandes y un gran número de mapas requieren una suscripción pagada.

Code license: Closed source
Last updated: 7 Jun 2016

Crowdmap permite al investigador armar un mapa Web basado en un tema en particular e invitar a varios usuarios (participantes, sujetos de la investigación, colaboradores, múltiples asistentes) para que aporten información al mapa en cualquier momento y por cuenta propia.

Por US$10 mensuales, los usuarios pueden comprar servicios arancelados, incluyendo mapas privados y personalizados.

Code license: GNU LGPL
Last updated: 7 Jun 2016

myHistro visualiza una serie de eventos a través del espacio y del tiempo. Permite a los investigadores crear una línea de tiempo interactiva y un mapa,que pueden enlazarse. Los usuarios de la línea del tiempo pueden presionar “reproducir” y mirar cómo se desplaza la línea del tiempo hacia adelante y también cómo el mapa se acerca a cada lugar cuando se señala cada evento (las imágenes y los textos adjuntados por los investigadores).

Code license: Closed source
Last updated: 7 Sep 2016

Overview is a tool for analyzing large sets of documents. In includes a sophisticated search engine, word clouds, entity detection, and topic-based document clustering. If that’s not good enough, you can write your own plugins using the API. It is open source and you can run it on your own computer.

It was originally designed for investigative journalists, but it’s now also used for qualitative research, social media conversation analysis, legal document review, digital humanities, and more.

Overview is built to do several types of tasks:

Code license: Open source
Last updated: 9 Mar 2016

Import.io es una plataforma web de software libre que pone el poder de la web legible por máquinas en manos de los usuarios. Usando sus herramientas se puede crear una API ( aplicación) o rastrear , scrapear una web entera en pocos minutos sin necesidad de contar con conocimientos de código.

Code license: Closed source
Last updated: 15 Jan 2016

Figshare es un repositorio donde los usuarios pueden hacer que todos sus productos de investigación a disposición de manera citable, compartible y reconocible. Todos los formatos de archivo se pueden publicar, incluyendo videos y conjuntos de datos que a menudo están resumidos a la sección de materiales suplementarios en los modelos actuales de publicación. Los usuarios del sitio mantienen el control total sobre la gestión de su investigación, mientras se benefician del acceso global, control de versiones y copias de seguridad seguras en la nube.

Code license: Closed source
Last updated: 29 Dec 2015

TwapperKeeper is now called Hootsuite Archives and can be accessed from within Hootsuite.

Code license: Closed source
Last updated: 13 Dec 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

Zoho ofrece una interfaz para arrastrar y soltar que permite crear aplicaciones que funcionan con bases de datos. Entre otras aplicaciones, permite crear formularios.

Code license: Closed source
Last updated: 3 Nov 2015

NVivo es un software comercial que realiza el análisis cualitativo de data desestructurados, en una variedad de formatos y diversas fuentes. Permite que los usuarios recolecte, organice y analice el contenido de entrevistas, se focalice en grupos de discusión, encuestas, audios, medios sociales y sitios webs.

Code license: Closed source
Last updated: 30 Oct 2015

Nodegot es un entorno virtual basado en la gestión, análisis y visualización de información.
Al utilizar Nodegoat, el usuario puede definir, crear, actualizar, consultar y administrar un gran número de datos mediante el uso de una interfaz de usuario gráfica. Su modelo de datos personalizados autoconfigura el eje de las funcionalidades básicas de Notegoat.

Code license: Closed source
Last updated: 17 Aug 2015

Editors' Notes es una herramienta basada en la web de código abierto para la grabación, organización, conservación, y el acceso a las notas de apertura de investigación, construido para las necesidades de los proyectos de edición de documentales, archivos y bibliotecas de colecciones especiales.

Code license: Open source
Last updated: 8 Jul 2015

Paperpile es un software de gestión de referencia comercial, que utiliza Internet, y pone especial énfasis en la integración de Google Docs y Google Scholar. Importa información desde sitios web de editores académicos hasta bases de datos como PubMed, Google Scholar, Google Books y arXiv. Paperpile puede recuperar y almacenar las publicaciones de archivos en PDF de aquellos usuarios con una cuenta en Google Drive.

Code license: Closed source
Last updated: 8 Jul 2015

Snapzen es una herramienta de búsqueda utilizada para colaborar con otras personas sobre la información de cualquier página web, directo desde el buscador.

El usuario puede intercambiar información sobre las páginas web con colegas, amigos o familiares. Es fácil colaborar con otras personas porque pueden ver exactamente lo mismo que se visualiza en las páginas web.

Snapzen es una gran alternativa si aún utiliza las funciones de copiar y pegar, herramientas de captura de pantalla, correo electrónico o chat para conversar sobre páginas webs.

Code license: Closed source
Last updated: 15 Jun 2015

WebClust es un metabuscador que agrupa documentos en conjuntos significativos. WebClust presenta los resultados de la búsqueda en una disposición horizontal por tema, además de una única lista vertical. La técnica de minería de datos de WebClust está diseñada para dar sentido a la gran cantidad de información textual de la web, incluidas las bibliotecas digitales.

Last updated: 14 Jun 2015

Open Science Framework (OSF) es una herramienta de código abierto gratuita diseñada para que los investigadores administren el flujo de trabajo de investigación en su totalidad: la planificación, la ejecución, la generación de informes, el archivado y el descubrimiento. Es en parte un software colaborativo y en parte, un sistema de control de versión. Se puede usar OSF para administrar proyectos individuales o proyectos colaborativos más extensos.

Code license: Apache License
Last updated: 14 Jun 2015

SylvaDB es un sistema de gestión de base de datos gráficos. Permite que aquellos usuarios que no poseen conocimiento alguno de la teoría de gráficos modelen, recopilen, consulten y analicen información en una estructura de red. SylvaDB provee herramientas para la creación de esquemas y modelos de manera fácil, la creación de formas automáticas para introducir datos, características colaborativas, un editor de consultas visual, búsquedas globales y locales, generación de informes gráficos, redes métricas y herramientas de visualización.

Code license: GNU Affero GPL v.3
Last updated: 9 Jun 2015

Textpresso es un sistema de minería de texto para literatura científica. Los dos elementos principales de Textpresso son (1) el acceso al texto completo, de modo que se pueden hacer búsquedas en artículos enteros, y (2) el uso de categorías de conceptos y clasificaciones de la biología que denotan una relación con un objeto dado (por ejemplo, asociación, regulación, etc.) o que lo describen (por ejemplo, métodos, etc.).

Code license: Open source
Last updated: 28 May 2015

140kit proporciona una capa de administración para la recolección y análisis de tuits.

Los datos sin procesar no se pueden enviar a los usuarios, pero 140kit permite ejecutar un proceso analítico en todo el conjunto de datos y guardarlos por un período deseado. Cuando se crean nuevos procesos analíticos, pueden ejecutarse en conjuntos de datos existentes. 140kit no solicita el control del análisis, pero retiene la propiedad de los datos recolectados.

Last updated: 24 May 2015

Scrapy es una biblioteca de programación de código abierto para el rastreo web y la extracción de texto de las páginas web escritas en Python. Se pueden realizar llamadas con la utilización del código Scrapy desde el interior de las aplicaciones y secuencias propias de cada usuario para así automatizar la tarea de extraer información de los sitios webs.

Code license: Open source
Last updated: 22 May 2015

AntWordProfiler es un software libre para el análisis de texto. En este caso analiza la frecuencia de palabras.

Last updated: 9 May 2015

MDID (Base de datos de imágenes digitales Madison) es un software para la enseñanza y el aprendizaje con imágenes digitales, con herramientas para descubrir, agregar, y elaborar presentaciones en medios digitales para una variedad de espacios de aprendizaje.

Code license: Open source, GNU GPL
Last updated: 8 May 2015

HTTrack es una interfaz fácil de usar que sirve para descargar sitios web (inclusive HTML, imágenes y otros archivos) o para actualizar una copia de un sitio previamente descargado.

Code license: Open source, GNU GPL
Last updated: 6 May 2015

Evernote es un software para archivar y gestionar notas o apuntes en la nube. Se pueden crear carpetas de notas de forma privada o pública . Los usuarios pueden tomar notas de texto, subir archivos para adjuntarlos a dichas notas o carpetas.
Evernote incorpora la opción OCR para imágenes con texto impreso o manuscrito.
Tiene una versión premium que permite el acceso de las notas de forma offline , mayor capacidad de almacenamiento y búsqueda de archivos PDF´s.

Code license: Closed source
Last updated: 2 May 2015

SearchTeam es un motor colaborativo de búsqueda que permite a los individuos y grupos para curar resultados de búsqueda en un SearchSpace público o compartido.

Code license: Closed source
Last updated: 1 May 2015

ScraperWiki es una herramienta en línea para hacer lo que hace el proceso simple de scraping de datos y más colaborativo. Cualquiera puede escribir un raspador de pantalla usando el editor de línea. En la versión gratuita, el código y los datos se comparten en abierto. Debido a que es un wiki, otros programadores pueden contribuir y mejorar el código.

Code license: GPL
Last updated: 1 May 2015

Luego de crear una cuenta gratuita, los usuarios pueden hacer minería de datos y analizar el contenido de JSTOR. Al enviar una solicitud de búsqueda, el usuario recibirá una muestra aleatoria de 1,000 documentos de entre los 4.6 millones alojados en JSTOR; se pueden recibir más documentos contactando a JSTOR directamente. Los usuarios pueden elegir recibir los siguientes resultados:

Last updated: 29 Apr 2015

STACK es una amplia caja de herramientas de investigación de redes sociales designada para recolectar, procesar y almacenar datos de redes sociales en línea. La caja de herramientas es un proyecto en curso de la Syracuse University iSchool, y actualmente soporta la API de Twitter. Está en desarrollo la obtención de datos de las páginas públicas de Facebook y la búsqueda en la API de Twitter. La arquitectura es modular y puede ser extendida. Se requiere competencias básicas en línea de comando de Linux / Mac.

Code license: Open source
Last updated: 21 Apr 2015

Academia.edu es una plataforma social que permite a los investigadores intercambiar sus artículos de investigación, literatura gris, reseñas y otros materiales académicos. El sitio ofrece estadísticas del número y origen geográfico de usuarios para perfiles y vistas de documentos. La afiliación académica se muestra en formato de árbol, agrupada por universidades y departamentos.

Code license: Closed source
Last updated: 21 Apr 2015

Bitext ofrece tecnologías semánticas multilingües en el campo del Análisis de Texto vía API con servicios como Extracción de Entidades, Extracción de Conceptos, Análisis de Emociones y Categorización de Texto.

Last updated: 25 Mar 2015

Content curation and topic discovery website based primarily on publishers the user follows through social media.

Code license: Open source
Last updated: 30 Jan 2015

Weka provides machine learning algorithms in Java for data mining and predictive modeling tasks. These algorithms can either be incorporated into other Java code or called from the Weka Workbench, a GUI environment.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

The Open Harvester Systems is a free metadata indexing system that allowers users to create a searchable index of the metadata from Open Archives Initiative (OAI)-compliant archives, such as sites using Open Journal Systems (OJS) or Open Conference Systems (OCS). It can harvest OAI metadata in a variety of schemas (including unqualified DC, the PKP (Open Journal Systems/Open Conference Systems) Dublin Core extension, MODS, and MARCXML).

Code license: GNU GPL
Last updated: 29 Dec 2014

Calibre is a free and open source ebook library management application, including options for syncing to devices and converting between a large number of formats. Calibre also has a built-in e-book editor for EPUB and AZW3 formats.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 29 Dec 2014

eXist-db is an open source database management system that stores XML data according to the XML data model and features efficient, index-based XQuery processing.

Code license: Open source, GNU GPL, GNU LGPL
Last updated: 29 Dec 2014

"The Virtual Lightbox for Museums and Archives (VLMA) is an educational tool for collecting and reusing in a structured fashion the online contents of museums and archives with visual components. With VLMA, you can browse and search collections, construct personal collections, export these collections to xml or Impress presentation format, annotate them, and share your collections with other VLMA users."

Code license: Open source
Last updated: 29 Dec 2014

LibLime Koha is a web-based, open source integrated library system (ILS) that has also been used for virtual library systems (e.g. recreating historic libraries). LibLime Koha offers libraries circulation policies, patron management modules, parent-child relationship for patron records, club and service management features, in-depth "holds" support, single click batch import "undo" option, EzProxy compatibility, self-checkout interface and more.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

DownThemAll is a Firefox plugin that allows users to download all the links or images contained in a webpage.

Last updated: 29 Dec 2014

GNU Wget is a free software package for retrieving files using HTTP, HTTPS and FTP.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Qiqqa is a research management software that allows you to organize large numbers of papers; find new papers to read and new information about papers you already have; review materials and create annotation reports. Qiqqa has several PDF tools that also allow you to convert from PDFs to text, and use a clipboard function to cut and paste text into your document.

Code license: Closed source
Last updated: 29 Dec 2014

MediaWiki is a free software open source wiki package written in PHP, originally for use on Wikipedia and other Wikimedia Foundation projects. It is designed to be run on a large server farm for a website that gets millions of hits per day.

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 29 Dec 2014

Archive-It is a subscription web archiving service from the Internet Archive that helps organizations to harvest, build, and preserve collections of digital content. Through our user friendly web application Archive-It partners can collect, catalog, and manage their collections of archived content with 24/7 access and full text search available for their use as well as their patrons. Content is hosted and stored at the Internet Archive data centers.

Last updated: 29 Dec 2014

SiteCrawler is a website downloading application that allows users to capture entire sites or selected portions of sites like image galleries.

Code license: Closed source
Last updated: 29 Dec 2014

OpenETD is an open source, web-based software application for managing the submission, approval, and distribution of electronic theses and dissertations (ETDs).

Code license: Open source, GNU GPL v3
Last updated: 29 Dec 2014

WikiPack is a web based personal information organizer and Markdown editor that uses Dropbox for synced storage. Using plain text Markdown files and WikiWords, WikiPack gives information context and links entries together by turning your Markdown pages into a private, password protected wiki. The easy to use Markdown language lets you create and edit your wiki pages without having to learn complex wiki syntax.

Code license: Closed source
Last updated: 29 Dec 2014

Pocket was founded in 2007 by Nate Weiner to help people save interesting articles, videos and more from the web for later enjoyment. Once saved to Pocket, the list of content is visible on any device — phone, tablet or computer. It can be viewed while waiting in line, on the couch, during commutes or travel — even offline.

Code license: Closed source
Last updated: 29 Dec 2014

News and RSS reader designed for iOS and Android mobile devices. Has been replaced by Google Play Newsstand (https://play.google.com/store/newsstand?hl=en)

Last updated: 29 Dec 2014

Manage and publish your existing journal, or lead the Open Access movement in your field by starting a new journal. Scholastica makes it easy to collaborate on a journal and publish scholarship at the click of a button.

Code license: Closed source
Last updated: 29 Dec 2014

Artifex Press is a publishing and technology company that digitally publishes catalogues raisonnés, a comprehensive, annotated documentation of all of the known artworks by an artists. They have developed a proprietary, patented software platform and a dedicated publishing program in order to create digital catalogues raisonnés. They offer both their own digital catalogues raisonnés and the ability to licence the software to produce your own projects.

Code license: Closed source
Last updated: 29 Dec 2014

ProProfs Poll Software, offers instructors, educators and organizations advanced options for creating effective online polls, in a matter of minutes. With ProProfs, anyone can create different kinds of polls using multiple choices, checkboxes and essay question types. Users can create text-based polls, image-based polls and even polls with a combination of text, images and videos. A set of advanced customization features allows users to create polls, using different themes, adding comment sections, shuffling answers and even adding an expiry date to the polls.

Last updated: 29 Dec 2014
CSV
Subscribe to Gathering