Data collection

What kind of data should the tool work with?

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 26 May 2018

Omeka es un sistema de gestión de contenidos diseñado para la visualización de bibliotecas, museos, archivos y colecciones académicas y exposiciones.

Code license: Open source, GNU GPL
Last updated: 19 Feb 2018

There is an unlimited number of videos, PDFs, etc. that can be used for education, training, instruction, or professional development.

Finding and curating them into playlists, integrating with existing workflow, and sharing with others is time consuming, inefficient, and often limited by ‘vendor lock-in.’

Media Share is a productivity tool that saves time, requires no training to use, and does not limit how or where content can be used.

Code license: Closed source
Last updated: 25 Oct 2017

Yahoo Pipes allows users to combine, filter, translate, and geocode data from RSS feeds, JSON, KML, or other similar formats, and power widgets/badges using that data.

Last updated: 18 Jan 2017

MyIndicators (http://myindicators.net/) is a digital, easy-to-use tool allows researchers, educators, students or anyone, to build their own tailored indicators (e.g. goals, strategies, parameters, survey, questions, calories intakes, alcohol consumptions or quantified self in terms of training, mood tracking or sleeping quality etc.)

Code license: Closed source
Last updated: 2 Sep 2016

Jotform allows users to create web forms (for surveys, etc.) using a drag-and-drop interface.

Code license: Closed source
Last updated: 10 Aug 2016

Geospatial Data Abstraction Library (GDAL) is a translator library for vector and raster geospatial data formats that is released under an X/MIT style Open Source license by the Open Source Geospatial Foundation.

Code license: Open source, MIT License
Last updated: 7 Jun 2016

ERDAS Imagine es una suite de programa de autoría de datos geo-espaciales. El programa posee un editor de gráficos de trama y un sensor remoto que efectúa análisis avanzados y modelado espacial para crear nueva información. ERDAS IMAGINE también sirve para visualizar resultados en 2D, 3D, vídeo y composiciones de mapas cartográficos de calidad. Está diseñado principalmente para procesamiento de tramas de datos y para la creación de imágenes digitales para mapeo en programas GIS o CAD.

Características:

Code license: Closed source
Last updated: 7 Jun 2016

ArcGIS es un grupo de programas compuesto por un Escritorio GIS, Servidor SIG, GIS Mobile y ArcGIS Online. ArcGIS es una plataforma para crear un sistema completo de información geográfica (SIG), que te permite fácilmente crear, editar y analizar datos geográficos en el escritorio; publicar datos, mapas, globos terráqueos y modelos a un servidor SIG, o compartirlos en línea; y luego poder utilizarlos en el escritorio, en la web o en el campo.

Code license: Closed source
Last updated: 7 Jun 2016

OpendTect es un software usado para el análisis y visualización de datos sísmicos multi-nivel.

Características:

  • Visualización y análisis de datos en 2D y 3D en un sólo estudio
  • Rastreo de horizonte en 2D y 3D incluyendo auto-rastreo, plano por plano , rastreo manual y lineal
  • Cálculo y análisis en modalidad interactiva de programación( live coding) de varios atributos y filtros
  • Complemento de configuración
Code license: Open source, GNU GPL
Last updated: 7 Jun 2016

A statistical package that may be used to compare quantified assemblages of broken and incomplete objects, such as ceramics, glass and bones. Pie-Slice uses Estimated Vessel Equivalent (EVE) as a base form of measurement, in which each measurable fraction is scored as a fraction of a complete vessel. It also trials the use of a new statistical transformation - the pseudo-count transformation - which converts EVEs into Pottery Information Equivalents (PIEs). The latter enables assemblages to be compared using techniques such as log-linear and correspondence analyses.

Last updated: 7 Jun 2016

The Altmetric Explorer is a powerful web app that allows you to track the conversations around scientific articles online. Altmetric collects and analyzes hundreds of thousands of postings about tens of thousands of articles and datasets each month. It makes this data available to end users through an intuitive user interface and to developers through an API.

Code license: Closed source
Last updated: 23 Mar 2016

Publish or Perish is a software program that retrieves and analyzes academic citations. It uses Google Scholar to obtain the raw citations, then analyzes these and presents the statistics.

Last updated: 24 Feb 2016

The TAPoR Portal is an online environment where users can keep track of texts they want to study (uploaded or available online), learn about and try different tools, and run tools on texts.

Last updated: 23 Feb 2016

The Entity Authority Tool Set (EATS) is a web application for recording, editing, using and displaying authority information about entities. It is designed to allow multiple authorities to each maintain their own independent data, while operating on a common base so that information about the same entity is all in one place. EATS also comes with client tools for automatically looking up entities in a text by name and adding appropriate TEI markup.
Features:

  • A web API for importing and exporting entity data
Code license: Open source, GNU GPL
Last updated: 26 Jan 2016

Specify is a database platform for museum and herbarium research data. It manages species and specimen information for computerizing biological collections, tracking museum specimen transactions, linking images to specimen records and publishing catalog data to the Internet. Specify is written in Java for Windows, Mac OS X, and Linux computers and uses the relational data manager, MySQL, as its data engine. Specify, Java, and MySQL are free and open-source.

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 10 Jan 2016

Zoho ofrece una interfaz para arrastrar y soltar que permite crear aplicaciones que funcionan con bases de datos. Entre otras aplicaciones, permite crear formularios.

Code license: Closed source
Last updated: 3 Nov 2015

El programa MONK workbench provee 525 obras de la Literatura de América del siglo XVIII y XIX y 37 obras de teatro y 5 obras de poesía escritas por William Shakespeare, junto con herramientas que permiten la investigación literaria a través del descubrimiento, el análisis y la visualización de patrones.

Last updated: 12 Aug 2015

LimeSurvey es una herramienta de encuesta web escrita en PHP usando MySQL, MSSQL o bases de datos Postgres. Posee un sitio multilingüe con demo, características y documentación [Open Source, GPL3]

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 7 Aug 2015

Kora es un depósito digital que permite que las instituciones manejen y distribuyan objetos e información digital.

Code license: Open source
Last updated: 5 Aug 2015

Bibliopedia lleva a cabo técnicas avanzas de extracción de datos y referencias cruzadas de literatura académica para crear un colaboratorio centrado en humanidades. Como un prototipo, busca herramientas como JSTOR y la Bibilioteca del Congreso de Estados Unidos para encontrar metadatos acerca de artículos académicos y libros que mencionan las narrativas de viaje medievales más famosas . “The Travels of Sir John Mandeville” , analiza los artículos y libros para las citas, luego guarda los resultados en una base de datos de acceso para todo público.

Code license: Open source
Last updated: 2 Jul 2015

Open Science Framework (OSF) es una herramienta de código abierto gratuita diseñada para que los investigadores administren el flujo de trabajo de investigación en su totalidad: la planificación, la ejecución, la generación de informes, el archivado y el descubrimiento. Es en parte un software colaborativo y en parte, un sistema de control de versión. Se puede usar OSF para administrar proyectos individuales o proyectos colaborativos más extensos.

Code license: Apache License
Last updated: 14 Jun 2015

Zotero es una herramienta gratuita que recolecta, gestiona y cita fuentes de investigación. Se puede descargar como extensión de Firefox, o desde Chrome y Safari. Una vez descargado permanece en la barra de herramientas como acceso directo haciendo su utilización rápida y fácil. Permite adjuntar archivos PDF, notas e imágenes a las citas, organizarlas en colecciones de fácil acceso para diferentes proyectos y en Open Office utilizando cualquiera de sus más de 2800 estilos de citas.

Code license: GNU Affero GPL
Last updated: 24 May 2015

TextGrid es un entorno de investigación virtual para Humanidades que brinda acceso integrado a herramientas especializadas, servicios y contenido y sirve como una suerte de archivo de larga duración para datos de investigación en Humanidades.

Last updated: 22 May 2015

Scrapy es una biblioteca de programación de código abierto para el rastreo web y la extracción de texto de las páginas web escritas en Python. Se pueden realizar llamadas con la utilización del código Scrapy desde el interior de las aplicaciones y secuencias propias de cada usuario para así automatizar la tarea de extraer información de los sitios webs.

Code license: Open source
Last updated: 22 May 2015

Silk es una plataforma para sitios que realizan recopilación de información. Es como Tumble pero para sitios que tienen un contenido estructurado, como revisión de software, información sobre diseñadores, un sitio con una base de datos de la ONU y mucho más. &#13

Last updated: 22 May 2015

Scripto es un motor para la externalización abierta de transcripciones de contenido que puede ser integrado con un sistema GUI para la personalización de transcripciones y con sistemas existentes de gestión de contenidos.

Last updated: 21 May 2015

Project le permite a los investigadores organizar y manejar todos los resultados de las investigaciones de manera segura, simple y organizada. Está diseñado para ayudar a los universitarios e investigadores académicos, en cualquier etapa de la carrera, a llevar un registro y así poder estar informados sobre todos los posibles resultados. Es una aplicación clara, útil, y sencilla que integra el flujo de trabajo existente del investigador para lograr una forma de trabajo más eficiente y asegurar así que tengan más tiempo para realizar más descubrimientos.

Last updated: 19 May 2015

Collex permite a los usuarios recopilar, anotar y etiquetar objetos en línea, para reutilizar en ensayos o exposiciones ilustrados interrelacionadas.

Last updated: 9 May 2015

Greenstone es un conjunto de programas informáticos para la construcción y distribución de librerías y colecciones de documentos digitales. También permite a los usuarios publicarlas en Internet o CD-ROM. La interfaz de software y documentación está disponible en Inglés, francés, español, ruso y kazajo.

Code license: Open source, GNU GPL
Last updated: 8 May 2015

CoCoCo es una aplicación para recolectar, catalogar y evaluar la calidad de los textos presentados o los archivos subidos por los usuarios.

Last updated: 8 May 2015

Heritrix es un rastreador web usado por el Archivo de Internet, que ofrece una interfaz de usuario basada en la web luego de una configuración inicial en una máquina de Linux. También utilizado por la Biblioteca del Congreso de los Estados Unidos, Heritrix captura metadatos en el formato Web ARChive (WARC).

Code license: Open source, Apache License
Last updated: 6 May 2015

SiteSucker es un programa OSX e iOS que puede descargar sitios web completos, incluyendo imágenes y vídeos.

Last updated: 6 May 2015

HTTrack es una interfaz fácil de usar que sirve para descargar sitios web (inclusive HTML, imágenes y otros archivos) o para actualizar una copia de un sitio previamente descargado.

Code license: Open source, GNU GPL
Last updated: 6 May 2015

Repositorio de software digital que puede utilizarse para aceptar, administrar y publicar objetos digitales. Es ampliamente utilizado en el mundo académico como un sistema para gestionar los trabajos de investigación académicos, tesis electrónicas y otros recursos digitales. EPrints ofrece una arquitectura plug-in extensible, permitiendo actividades de procesamiento de datos para ser adaptadas a las necesidades de cada institución.

Code license: Open source, GNU GPL
Last updated: 1 May 2015

ScraperWiki es una herramienta en línea para hacer lo que hace el proceso simple de scraping de datos y más colaborativo. Cualquiera puede escribir un raspador de pantalla usando el editor de línea. En la versión gratuita, el código y los datos se comparten en abierto. Debido a que es un wiki, otros programadores pueden contribuir y mejorar el código.

Code license: GPL
Last updated: 1 May 2015

Wiggio is a free service that allows users to create groups, host virtual meetings and conference calls, manage events, create to-do lists, poll members, send messages, and upload and manage folders. You can connect with your FaceBook account or create a new and free account with Wiggio. They are no longer supporting previously available Wiggio apps.

Code license: Closed source
Last updated: 22 Mar 2015

Freedity can create an RSS feed from any web page, with the number of feeds and update interval varying based on the tier of the subscription.

Last updated: 5 Mar 2015

R

R is a free software environment for statistical computing and graphics. R can be run from the command line, or using any of the many graphical user interfaces available on a variety of platforms; these are listed as separate tools.

Code license: GPL
Last updated: 29 Jan 2015

The Open Harvester Systems is a free metadata indexing system that allowers users to create a searchable index of the metadata from Open Archives Initiative (OAI)-compliant archives, such as sites using Open Journal Systems (OJS) or Open Conference Systems (OCS). It can harvest OAI metadata in a variety of schemas (including unqualified DC, the PKP (Open Journal Systems/Open Conference Systems) Dublin Core extension, MODS, and MARCXML).

Code license: GNU GPL
Last updated: 29 Dec 2014

Calibre is a free and open source ebook library management application, including options for syncing to devices and converting between a large number of formats. Calibre also has a built-in e-book editor for EPUB and AZW3 formats.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 29 Dec 2014

text analytic and data extraction framework: data and semantic analytics in a suite of business applications.

Last updated: 29 Dec 2014

Twapper Keeper lets users create an archive of tweets based on hashtag, keyword, or person, for them to review online.

Last updated: 29 Dec 2014

Formspring allows users to create and answer questionnaires either within the web interface or using an iOS app.

Last updated: 29 Dec 2014

ScrapBook is a Firefox extension, which helps you to save Web pages and easily manage collections. Major features are:
* Save Web page
* Save snippet of Web page
* Save Web site
* Organize the collection in the same way as Bookmarks
* Full text search and quick filtering search of the collection
* Editing of the collected Web page
* Text/HTML edit feature resembling Opera's Notes

Last updated: 29 Dec 2014

Survey Monkey is a web-based survey creation and distribution site, with free and paid plans that allow users to create surveys and collect responses through a link, email, Facebook, or being embedded in a website or blog. Survey Monkey also allows for the collect and analysis of data.

Code license: Closed source
Last updated: 29 Dec 2014

"The Virtual Lightbox for Museums and Archives (VLMA) is an educational tool for collecting and reusing in a structured fashion the online contents of museums and archives with visual components. With VLMA, you can browse and search collections, construct personal collections, export these collections to xml or Impress presentation format, annotate them, and share your collections with other VLMA users."

Code license: Open source
Last updated: 29 Dec 2014

The Blog Analysis Toolkit (BAT) is a free, Web-based system for capturing, archiving and sharing blog posts. Blog posts are acquired via RSS feeds, and stored in a database where they can be accessed and shared by other researchers. Free registration is required.

Last updated: 29 Dec 2014

online spreadsheets, collaborative editing, connected to data sources

Last updated: 29 Dec 2014

Zoomerang is online survey software; paid plans include analysis tools. Zommerang is now part of Survey Monkey.

Last updated: 29 Dec 2014

The Bamboo Content Interoperability Hub (CI gub) is an effort to largely automate the time-consuming process of downloading and compiling data from different repositories and archives and standardizing some of the format differences.

Last updated: 29 Dec 2014

DownThemAll is a Firefox plugin that allows users to download all the links or images contained in a webpage.

Last updated: 29 Dec 2014

GNU Wget is a free software package for retrieving files using HTTP, HTTPS and FTP.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Adobe Bridge is a media management application used for organizing, browsing, locating, and viewing creative assets. It was provided as a part of the Adobe Creative Suite, beginning with CS2, and is now in version CS5

Features:

  • Tightly integrated with other Adobe suite software (except for the standalone version of Adobe Acrobat 8)
  • Extensible through use of Javascript
Code license: Closed source
Last updated: 29 Dec 2014

Pattern is a Python web mining module with tools for data retrieval (Google + Twitter + Wikipedia API, web spider, HTML DOM parser), text analysis (rule-based shallow parser, WordNet interface, syntactical + semantical n-gram search algorithm, tf-idf + cosine similarity + LSA metrics) and data visualization (graph networks).

Code license: BSD, Open source
Last updated: 29 Dec 2014

Archive-It is a subscription web archiving service from the Internet Archive that helps organizations to harvest, build, and preserve collections of digital content. Through our user friendly web application Archive-It partners can collect, catalog, and manage their collections of archived content with 24/7 access and full text search available for their use as well as their patrons. Content is hosted and stored at the Internet Archive data centers.

Last updated: 29 Dec 2014

Google Scholar Citations lets you track citations to your publications, check who is citing your publications, graph your citations over time, compute citation metrics, and view publications by colleagues.

Last updated: 29 Dec 2014

All Our Ideas is a research project that seeks to develop a new form of social data collection by combining the best features of quantitative and qualitative methods. Using the power of the web, we are creating a data collection tool that has the scale, speed, and quantification of a survey while still allowing for new information to "bubble up" from respondents as happens in interviews, participant observation, and focus groups.

Code license: Open source, BSD
Last updated: 29 Dec 2014

The Dataverse Network is an application to publish, share, reference, extract and analyze research data. It facilitates making data available to others, and allows to replicate others work. Researchers and data authors get credit, publishers and distributors get credit, affiliated institutions get credit.

Code license: Apache License, Open source
Last updated: 29 Dec 2014

Korbo is a powerful aggregation platform for gathering Linked Data objects relevant to your area of research into single workspaces or “baskets”.

Korbo is targeted primarily at developers who want to build applications on top of its API and make full use of the linked cultural data from sources such as Europeana, FreeBase and DBPedia.

Korbo is currently in the early stages of development, but you can already try out a demo version of the platform.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

The Observer XT is the professional and user-friendly event logging software for the collection, analysis, and presentation of observational data.

Last updated: 29 Dec 2014

LitBlitz is free beta Chrome extension that aims to improve how students and researchers manage their notes for literature reviews, assignment research and more by simplifying pdf management, allowing capture and annotation of document snippets


LitBlitz v1.0 is currently available as a Google Chrome extension.

LitBlitz, while still available on the Google Chrome store no longer appears to be under development, and the company url redirects to a Japanese language web page.

Last updated: 29 Dec 2014

LimeService is basically the hosted version of the GNU licensed LimeSurvey. It is a survey service-platform to prepare, run and evaluate on-line surveys. Besides basic free usage you are always getting the full feature set with no monthly fees or subscription plans.

I've used it before and found it to pretty robust.

Last updated: 29 Dec 2014

Artifex Press is a publishing and technology company that digitally publishes catalogues raisonnés, a comprehensive, annotated documentation of all of the known artworks by an artists. They have developed a proprietary, patented software platform and a dedicated publishing program in order to create digital catalogues raisonnés. They offer both their own digital catalogues raisonnés and the ability to licence the software to produce your own projects.

Code license: Closed source
Last updated: 29 Dec 2014

Zapier provides a means to create on-the-fly data connections between applications which may not have open API's. Zapier works with a wide range of popular applications - a list of current ones is available at: https://zapier.com/zapbook/apps/.

Last updated: 29 Dec 2014
Code license: GNU Affero GPL v.3
Last updated: 29 Dec 2014
CSV
Subscribe to Data collection