Capture

What kind of data should the tool work with?

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 13 Oct 2017

Tackk es un servicio gratuito que ayuda a que la publicación de contenido en un sitio electrónico sea tan fácil como escribir un correo electrónico.

Code license: Closed source
Last updated: 12 Apr 2017

Sifter provides search and retrieve access to every undeleted Tweet in the history of Twitter. Users can submit three historical Twitter estimate requests per day using a variety of Gnip PowerTrack rules. When the query is done, Sifter generates an email estimating the approximate number of tweets responsive to the query and the cost to get access to the data via DiscoverText.

Code license: Closed source
Last updated: 24 Feb 2017

Gephi software de gráficos que proporciona una manera de explorar datos a través de la visualización y análisis de redes.

Code license: Open source, GNU GPL v3
Last updated: 15 Feb 2017

Recogito is an online platform for collaborative document annotation.

Recogito provides a personal workspace where you can upload, collect and organize your source materials - texts and images - and collaborate in their annotation and interpretation. Recogito enables you to make your work more visible on the Web more easily, and to expose the results of your research as Open Data.

Code license: Open source, Apache License
Last updated: 21 Dec 2016

Jotform allows users to create web forms (for surveys, etc.) using a drag-and-drop interface.

Code license: Closed source
Last updated: 10 Aug 2016

The FAIMS Mobile Platform (http://www.fedarch.org) is an open source, generalised system for digital data collection on Android. It works offline and helps record free text, multimedia, structured or spatial data with ample opportunity for the capture of metadata and certainty components of the captured data. It needs to be customised (via an xml definition document) for particular field/lab workflows. As a server-client system it facilitates simultaneous operation by multiple users.

Code license: Open source
Last updated: 28 Jun 2016

Roambi Flow es un servicio de publicación en línea con sistema operativo iOS. Roambi le permite al usuario transformar los datos de Excel y otras publicaciones en visualizaciones compatibles con el teléfono móvil, y a su vez enviarlas a su iPhone o iPad.

Code license: Closed source
Last updated: 18 May 2016

Motor de (reconocimiento óptico de caracteres) para la creación de archivos electrónicos editables y de búsqueda de documentos en papel escaneados, archivos PDF y fotografías digitales.
Características:
Reconocimiento de imágenes de cámara digital y cámara de teléfono móvil
Reconocimiento de idioma
Integración completa con aplicaciones de Office
Conversión de PDF, archivo y seguridad

Code license: Closed source
Last updated: 17 May 2016

DM is an environment for the study and annotation of images and texts. It is a suite of tools, enabling scholars to gather and organize the evidence necessary to support arguments based in digitized resources. DM enables users to mark fragments of interest in manuscripts, print materials, photographs, etc. and provide commentary on these resources and the relationships among them.

Last updated: 1 May 2016

Online Digital Asset Management (DAM) and collaboration platform for business use. Offers user management, custom branding and password-protected folders.

Code license: Closed source
Last updated: 27 Mar 2016

Bookworm es una herramienta que permite, de manera simple y potente, visualizar las tendencias de uso del lenguaje en los repositorios de textos digitalizados. Es una herramienta para la exploración culturómica a través de la observación de tendencias cronológicas para palabras y frases en colecciones de documentos de texto con niveles de metadatos.

Code license: Open source
Last updated: 11 Mar 2016

Overview is a tool for analyzing large sets of documents. In includes a sophisticated search engine, word clouds, entity detection, and topic-based document clustering. If that’s not good enough, you can write your own plugins using the API. It is open source and you can run it on your own computer.

It was originally designed for investigative journalists, but it’s now also used for qualitative research, social media conversation analysis, legal document review, digital humanities, and more.

Overview is built to do several types of tasks:

Code license: Open source
Last updated: 9 Mar 2016

Audacity sirve para grabar y editar audio. Es fácil de usar y multilingüe. Las características básicas, según figura en su página web, son las siguientes:

  • Graba audio en vivo.
  • Graba audio desde computadoras con Windows Vista o posteriores.
  • Convierte cintas en versión digital o CDs.
  • Edita archivos de sonido WAV, AIFF, FLAC, MP2, MP3 o Ogg Vorbis.
  • Corta, copia, une o mezcla sonidos.
Code license: Open source, GNU GPL
Last updated: 24 Feb 2016

The LC Newspaper Viewer is an open-source web application that understands how to model newspaper data created according to a set of technical guidelines, with the goal of publishing an online archive like Chronicling America.

Code license: Open source
Last updated: 23 Feb 2016

Combinado con Leptonica, la Biblioteca para el Procesamiento de Imágenes, Tesseract puede leer una gran variedad de formatos de imagen y convertirlos a texto en más de 40 idiomas.

Este código es un simple motor de OCR. No tiene formato de salida ni interfaz de usuario. Puede detectar tono fijo y texto proporcional. Sin embargo, en 1995 este motor estaba entre los 3 mejores en términos de precisión de caracteres, y opera tanto en Linux como en Windows. El código de programación está incluido en la versión de código abierto.

Code license: Open source, Apache License
Last updated: 27 Jan 2016

Import.io es una plataforma web de software libre que pone el poder de la web legible por máquinas en manos de los usuarios. Usando sus herramientas se puede crear una API ( aplicación) o rastrear , scrapear una web entera en pocos minutos sin necesidad de contar con conocimientos de código.

Code license: Closed source
Last updated: 15 Jan 2016

Figshare es un repositorio donde los usuarios pueden hacer que todos sus productos de investigación a disposición de manera citable, compartible y reconocible. Todos los formatos de archivo se pueden publicar, incluyendo videos y conjuntos de datos que a menudo están resumidos a la sección de materiales suplementarios en los modelos actuales de publicación. Los usuarios del sitio mantienen el control total sobre la gestión de su investigación, mientras se benefician del acceso global, control de versiones y copias de seguridad seguras en la nube.

Code license: Closed source
Last updated: 29 Dec 2015

Textal es una aplicación gratuita de iOS para el análisis de textos. Textal permite analizar documentos, cadenas de mensajes en Twitter y páginas web. También posibilita la creación nubes de texto con enlace a los datos fuente. Trae una memoria cargada con un gran número de textos en el dominio público. Las nubes de texto se pueden compartir fácilmente a través de Twitter o por correo electrónico.

Last updated: 18 Dec 2015

TwapperKeeper is now called Hootsuite Archives and can be accessed from within Hootsuite.

Code license: Closed source
Last updated: 13 Dec 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

NVivo es un software comercial que realiza el análisis cualitativo de data desestructurados, en una variedad de formatos y diversas fuentes. Permite que los usuarios recolecte, organice y analice el contenido de entrevistas, se focalice en grupos de discusión, encuestas, audios, medios sociales y sitios webs.

Code license: Closed source
Last updated: 30 Oct 2015

Jing le permite al usuario tomar capturas de imagen, registrar grabaciones de imágenes y compartir información de forma instantánea. Jing es la parte inferíor de una serie de productos de captura de imágenes. SnagIt brinda una cantidad de características extra (como guardar videos en formatos SWF) a un bajo costo. Camtasi se encuentra, en cambio, en el extremo superior, con una completa capacidad para editar videos.

Last updated: 5 Oct 2015

Es una herramienta de captura de imagen y screencasting. SnagIt es parte de la familia de los productos de edición de video y captura de imagen TechSmith. Jing ofrece menos funciones, pero es una alternativa gratis. Camtasia es el producto con más funciones, pero también es el más costoso.

Code license: Closed source
Last updated: 2 Oct 2015

Camtasia is Mac/Windows software for recording screencasts and editing video. Videos can be sent directly to YouTube or integrated with Google Drive. Camtasia is the high end of a suite of screen capture products. SnagIt is a cheaper alternative with fewer features. Jing, the most basic of the TechSmith screen capture products, is free.

Code license: Closed source
Last updated: 8 Sep 2015

Snapzen es una herramienta de búsqueda utilizada para colaborar con otras personas sobre la información de cualquier página web, directo desde el buscador.

El usuario puede intercambiar información sobre las páginas web con colegas, amigos o familiares. Es fácil colaborar con otras personas porque pueden ver exactamente lo mismo que se visualiza en las páginas web.

Snapzen es una gran alternativa si aún utiliza las funciones de copiar y pegar, herramientas de captura de pantalla, correo electrónico o chat para conversar sobre páginas webs.

Code license: Closed source
Last updated: 15 Jun 2015

SylvaDB es un sistema de gestión de base de datos gráficos. Permite que aquellos usuarios que no poseen conocimiento alguno de la teoría de gráficos modelen, recopilen, consulten y analicen información en una estructura de red. SylvaDB provee herramientas para la creación de esquemas y modelos de manera fácil, la creación de formas automáticas para introducir datos, características colaborativas, un editor de consultas visual, búsquedas globales y locales, generación de informes gráficos, redes métricas y herramientas de visualización.

Code license: GNU Affero GPL v.3
Last updated: 9 Jun 2015

Textpresso es un sistema de minería de texto para literatura científica. Los dos elementos principales de Textpresso son (1) el acceso al texto completo, de modo que se pueden hacer búsquedas en artículos enteros, y (2) el uso de categorías de conceptos y clasificaciones de la biología que denotan una relación con un objeto dado (por ejemplo, asociación, regulación, etc.) o que lo describen (por ejemplo, métodos, etc.).

Code license: Open source
Last updated: 28 May 2015

140kit proporciona una capa de administración para la recolección y análisis de tuits.

Los datos sin procesar no se pueden enviar a los usuarios, pero 140kit permite ejecutar un proceso analítico en todo el conjunto de datos y guardarlos por un período deseado. Cuando se crean nuevos procesos analíticos, pueden ejecutarse en conjuntos de datos existentes. 140kit no solicita el control del análisis, pero retiene la propiedad de los datos recolectados.

Last updated: 24 May 2015

Whatizit puede adquirir hasta 500.000 términos que se copian en el cuadro de texto, para ejecutar cualquier operación de segmentación de análisis de texto predefinida.

Last updated: 23 May 2015

Gamera es una serie de herramientas (bajo la Licencia Pública GNU) utilizada para el desarrollo de sistemas de reconocimiento de imágenes en documentos.
Las características son las siguientes:
- Los diccionarios especializados pueden crearse para asistir el análisis de tipo de registro específico.
-Funcionalidad extensible.
-Reconocimiento óptimo de caracteres (OCR por sus siglas en inglés) toolkit plugin

Code license: Open source, GNU GPL
Last updated: 22 May 2015

Scrapy es una biblioteca de programación de código abierto para el rastreo web y la extracción de texto de las páginas web escritas en Python. Se pueden realizar llamadas con la utilización del código Scrapy desde el interior de las aplicaciones y secuencias propias de cada usuario para así automatizar la tarea de extraer información de los sitios webs.

Code license: Open source
Last updated: 22 May 2015

Los usuarios pueden subir fotos y organizarlas en álbumes, y pueden buscar fotos que han sido subidas a álbumes públicos y filtrar los resultados por licencias (cualquier licencia Creative Commons, licencias que permiten el uso comercial, licencias que permiten la recombinación).

Last updated: 18 May 2015

Lynks es una herramienta fácil de usar que se incorpora al navegador y se utiliza para crear redes. Lynks es una iniciativa del Centre for Innovation, perteneciente a la Universidad de Leiden University (Campus La Haya). El programa fue desarrollado en 2014 contó con la colaboración y experiencia del Dr. Eelke Heemskerk de la Universidad de Ámsterdam. El desarrollo del programa fue financiado con aportes del Fondo Europeo de Desarrollo Regional (EFRO, según las siglas en inglés) y la Municipalidad de La Haya.

Code license: Closed source
Last updated: 12 May 2015

MDID (Base de datos de imágenes digitales Madison) es un software para la enseñanza y el aprendizaje con imágenes digitales, con herramientas para descubrir, agregar, y elaborar presentaciones en medios digitales para una variedad de espacios de aprendizaje.

Code license: Open source, GNU GPL
Last updated: 8 May 2015

Heritrix es un rastreador web usado por el Archivo de Internet, que ofrece una interfaz de usuario basada en la web luego de una configuración inicial en una máquina de Linux. También utilizado por la Biblioteca del Congreso de los Estados Unidos, Heritrix captura metadatos en el formato Web ARChive (WARC).

Code license: Open source, Apache License
Last updated: 6 May 2015

SiteSucker es un programa OSX e iOS que puede descargar sitios web completos, incluyendo imágenes y vídeos.

Last updated: 6 May 2015

HTTrack es una interfaz fácil de usar que sirve para descargar sitios web (inclusive HTML, imágenes y otros archivos) o para actualizar una copia de un sitio previamente descargado.

Code license: Open source, GNU GPL
Last updated: 6 May 2015

FromThePage es un software gratuito que permite transcribir documentos manuscritos en línea. Facilita la indexación y marcación de contenidos dentro del texto utilizando marcadores similares a los wiki. Los usuarios pueden discutir la escritura difícil o palabras oscuras dentro de una página para refinar su transcripción. Los textos resultantes se alojan en la web, por lo que resultan fáciles de buscar y leer.

Code license: Open source, GNU Affero GPL
Last updated: 2 May 2015

Evernote es un software para archivar y gestionar notas o apuntes en la nube. Se pueden crear carpetas de notas de forma privada o pública . Los usuarios pueden tomar notas de texto, subir archivos para adjuntarlos a dichas notas o carpetas.
Evernote incorpora la opción OCR para imágenes con texto impreso o manuscrito.
Tiene una versión premium que permite el acceso de las notas de forma offline , mayor capacidad de almacenamiento y búsqueda de archivos PDF´s.

Code license: Closed source
Last updated: 2 May 2015

SearchTeam es un motor colaborativo de búsqueda que permite a los individuos y grupos para curar resultados de búsqueda en un SearchSpace público o compartido.

Code license: Closed source
Last updated: 1 May 2015

ScraperWiki es una herramienta en línea para hacer lo que hace el proceso simple de scraping de datos y más colaborativo. Cualquiera puede escribir un raspador de pantalla usando el editor de línea. En la versión gratuita, el código y los datos se comparten en abierto. Debido a que es un wiki, otros programadores pueden contribuir y mejorar el código.

Code license: GPL
Last updated: 1 May 2015

PDFMiner es una herramienta de Python para extraer información de documentos PDF (no sólo texto, sino también información acerca de las fuentes, codificación y diseño).

Code license: MIT License
Last updated: 1 May 2015

Luego de crear una cuenta gratuita, los usuarios pueden hacer minería de datos y analizar el contenido de JSTOR. Al enviar una solicitud de búsqueda, el usuario recibirá una muestra aleatoria de 1,000 documentos de entre los 4.6 millones alojados en JSTOR; se pueden recibir más documentos contactando a JSTOR directamente. Los usuarios pueden elegir recibir los siguientes resultados:

Last updated: 29 Apr 2015

Academia.edu es una plataforma social que permite a los investigadores intercambiar sus artículos de investigación, literatura gris, reseñas y otros materiales académicos. El sitio ofrece estadísticas del número y origen geográfico de usuarios para perfiles y vistas de documentos. La afiliación académica se muestra en formato de árbol, agrupada por universidades y departamentos.

Code license: Closed source
Last updated: 21 Apr 2015

Bitext ofrece tecnologías semánticas multilingües en el campo del Análisis de Texto vía API con servicios como Extracción de Entidades, Extracción de Conceptos, Análisis de Emociones y Categorización de Texto.

Last updated: 25 Mar 2015

Extensive set of tools to allow collaborative transcription of manuscript pages in TEI-compliant XML.

Features of T-PEN through version 1.2 [from project blog]

Zoom Tool in Transcription User Interface: Holding CTRL+SHIFT will result in a magnified image of the current line being transcribed.

Last updated: 17 Mar 2015

Photoshop Express allows simple web-based image editing and cloud storage (2 GB free via Adobe Revel), as well as video storage and streaming, slideshow templates, and a photo gallery. Features include online galleries and slideshows, exporting and searching images, and privacy settings. Android, Windows and iOS (including iPad) apps are available.

Code license: Closed source
Last updated: 29 Dec 2014

Calibre is a free and open source ebook library management application, including options for syncing to devices and converting between a large number of formats. Calibre also has a built-in e-book editor for EPUB and AZW3 formats.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 29 Dec 2014

eXist-db is an open source database management system that stores XML data according to the XML data model and features efficient, index-based XQuery processing.

Code license: Open source, GNU GPL, GNU LGPL
Last updated: 29 Dec 2014

"The Virtual Lightbox for Museums and Archives (VLMA) is an educational tool for collecting and reusing in a structured fashion the online contents of museums and archives with visual components. With VLMA, you can browse and search collections, construct personal collections, export these collections to xml or Impress presentation format, annotate them, and share your collections with other VLMA users."

Code license: Open source
Last updated: 29 Dec 2014

LibLime Koha is a web-based, open source integrated library system (ILS) that has also been used for virtual library systems (e.g. recreating historic libraries). LibLime Koha offers libraries circulation policies, patron management modules, parent-child relationship for patron records, club and service management features, in-depth "holds" support, single click batch import "undo" option, EzProxy compatibility, self-checkout interface and more.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

CamStudio is free and open source screencasting software that saves the video as AVI files, though a Flash converter is included.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

Capture Fox is a Firefox plugin that allows the user to record their voice and their sccreen.

Last updated: 29 Dec 2014

ScreenFlick enables large-resolution recording, allowing you to make videos of screencasts with audio.

Code license: Closed source
Last updated: 29 Dec 2014

Screenr is a free web-based screen recording program that allows you to create and share screencasts on the web. You can record on a Mac or PC, and the recordings play everywhere, including iPhones. Very easy to use.

Last updated: 29 Dec 2014

ScreenFlow is a screen recording software for the Mac that allows you to record, edit and share audio and video on your computer.

Code license: Closed source
Last updated: 29 Dec 2014

Snapz Pro X allows you to record anything on your computer screen. You can save audio or video as a QuickTime® movie or screenshot that can be shared.

Last updated: 29 Dec 2014

TipCam is a screen recording software for Windows, which allows you to record images and audio on your screen, and upload to YouTube. Latest version was released in 2008, likely not supported anymore.

Code license: Closed source
Last updated: 29 Dec 2014

Wink is a tutorial and presentation creation software, that allows you to create tutorials on how to use software, by capturing screenshots, mouse movements, and accompanying audio.

Last updated: 29 Dec 2014

Qiqqa is a research management software that allows you to organize large numbers of papers; find new papers to read and new information about papers you already have; review materials and create annotation reports. Qiqqa has several PDF tools that also allow you to convert from PDFs to text, and use a clipboard function to cut and paste text into your document.

Code license: Closed source
Last updated: 29 Dec 2014

Dragon Dictation is a voice recognition application that allows you to speak and instantly see your text content from email messages to blog posts on your iPad, iPhone, or iPod Touch.

Code license: Closed source
Last updated: 21 Feb 2017

MediaWiki is a free software open source wiki package written in PHP, originally for use on Wikipedia and other Wikimedia Foundation projects. It is designed to be run on a large server farm for a website that gets millions of hits per day.

Code license: Open source, GNU GPL, GNU GPL v2
Last updated: 29 Dec 2014

Express Scribe is a professional audio player software for PC or Mac that assists in the transcription of audio recordings.

Code license: Closed source
Last updated: 29 Dec 2014

eLaborate is an online work environment in which scholars can upload scans, transcribe and annotate text, and publish the results as on online text edition which is freely available to all users.

Code license: GNU GPL v3
Last updated: 29 Dec 2014

Mnemomap is a flash interactive search engine that generates a visual "Atomic-Tree", sends your queries to a Query List, and delivers the search results. The Atomic-Tree allows you to improve your query mid-search. The Query List allows you to customize your search query.

Last updated: 29 Dec 2014

Silobreaker is a search engine that aggregates the news from numerous sources and presents the contents in various visualization formats.

Last updated: 29 Dec 2014

Archive-It is a subscription web archiving service from the Internet Archive that helps organizations to harvest, build, and preserve collections of digital content. Through our user friendly web application Archive-It partners can collect, catalog, and manage their collections of archived content with 24/7 access and full text search available for their use as well as their patrons. Content is hosted and stored at the Internet Archive data centers.

Last updated: 29 Dec 2014

HandBrake is an open-source, GPL-licensed, multiplatform, multithreaded video transcoder

Code license: Open source
Last updated: 29 Dec 2014

OpenETD is an open source, web-based software application for managing the submission, approval, and distribution of electronic theses and dissertations (ETDs).

Code license: Open source, GNU GPL v3
Last updated: 29 Dec 2014

SiteCrawler is a website downloading application that allows users to capture entire sites or selected portions of sites like image galleries.

Code license: Closed source
Last updated: 29 Dec 2014

Search Flickr for photos, sort according to license types. Contains commercial as well as Creative Commons licensed photos.

Code license: Open source
Last updated: 29 Dec 2014

Insync extends Google Drive's web functionality to your desktop by integrating with Windows, Mac and Linux platforms. Insync allows for built-in sharing without a browser, multiple account support, on-demand shared file syncing, desktop notifications and more.

Code license: Closed source
Last updated: 29 Dec 2014

Mac and Windows tool for taking multiple screenshots, annotating them, and combining them into a single document.

Code license: Closed source
Last updated: 29 Dec 2014

Manage and publish your existing journal, or lead the Open Access movement in your field by starting a new journal. Scholastica makes it easy to collaborate on a journal and publish scholarship at the click of a button.

Code license: Closed source
Last updated: 29 Dec 2014

The DocScanner app uses a device's built-in camera to scan documents. Features include image optimization, OCR, document type recognition (document, business card, receipt, etc.), autosorting, and ability to upload documents to Evernote, Dropbox, and Google Drive.

Code license: Closed source
Last updated: 29 Dec 2014

Circos is a software package for visualizing data and information. It visualizes data in a circular layout — this makes Circos ideal for exploring relationships between objects or positions. There are other reasons why a circular layout is advantageous, not the least being the fact that it is attractive.
Circos is ideal for creating publication-quality infographics and illustrations with a high data-to-ink ratio, richly layered data and pleasant symmetries. You have fine control each element in the figure to tailor its focus points and detail to your audience.

Code license: GPL
Last updated: 29 Dec 2014
CSV
Subscribe to Capture