Conversion

What kind of data should the tool work with?

Textable is an open source program for text analysis. It offers a set of basic text-analytic components (e.g. import text from files, segment into words, measure segment diversity, etc.), which the user combines using a visual interface to build custom analytic workflows.

Code license: GNU GPL v3
Last updated: 20 Aug 2017

EPPT allows users to encode image-based scholarly editions without having to know XML syntax. It automates or semi-automates repeating attributes, and provides templates to reduce errors and accelerate the encoding process.

Last updated: 9 Aug 2016

Una herramienta para convertir PDF escaneados y de imagen a Word, Excel, PPT, Keynote, Pages, texto, etc en Mac.
Características:
Convertir PDF a Word (.doc), Excel (.xlsx), y Office
Convertir PDF a Pages y Keynote
Convertir PDF a archivos gráficos
Convertir PDF escaneados con OCR
Convertir archivos PDF multilingüe
Soporta PDF restringidos con contraseña
Extrae porciones de texto, imagen o tablas de reconstrucción del documento

Code license: Closed source
Last updated: 29 May 2016

CLAW es el software del idioma inglés para llevar a cabo el etiquetado gramatical (POS, por sus siglas en inglés). La clasificación de palabras en una o más categorías basada en su definición, su relación con otras palabras y otros contextos, también conocida como “etiquetado de clase de palabras”.

Code license: Closed source
Last updated: 3 May 2016

Smallpdf es una herramienta online gratuita para comprimir, fusionar, dividir y convertir documentos PDF. Es fácil de utilizar y de uso gratuito. Es útil para comprimir documentos de investigación, combinar varios documentos juntos o extraer gráficos e imágenes de archivos PDF.

Code license: Closed source
Last updated: 29 Mar 2016

CloudConvert supports the conversion between more than 200 different audio, video, document, ebook, archive, image, spreadsheet and presentation formats.

The CloudConvert API offers the full functionality of CloudConvert and makes it possible to use the conversion services in your own applications.

Code license: Closed source
Last updated: 10 Mar 2016

Overview is a tool for analyzing large sets of documents. In includes a sophisticated search engine, word clouds, entity detection, and topic-based document clustering. If that’s not good enough, you can write your own plugins using the API. It is open source and you can run it on your own computer.

It was originally designed for investigative journalists, but it’s now also used for qualitative research, social media conversation analysis, legal document review, digital humanities, and more.

Overview is built to do several types of tasks:

Code license: Open source
Last updated: 9 Mar 2016

Audacity sirve para grabar y editar audio. Es fácil de usar y multilingüe. Las características básicas, según figura en su página web, son las siguientes:

  • Graba audio en vivo.
  • Graba audio desde computadoras con Windows Vista o posteriores.
  • Convierte cintas en versión digital o CDs.
  • Edita archivos de sonido WAV, AIFF, FLAC, MP2, MP3 o Ogg Vorbis.
  • Corta, copia, une o mezcla sonidos.
Code license: Open source, GNU GPL
Last updated: 24 Feb 2016

Combinado con Leptonica, la Biblioteca para el Procesamiento de Imágenes, Tesseract puede leer una gran variedad de formatos de imagen y convertirlos a texto en más de 40 idiomas.

Este código es un simple motor de OCR. No tiene formato de salida ni interfaz de usuario. Puede detectar tono fijo y texto proporcional. Sin embargo, en 1995 este motor estaba entre los 3 mejores en términos de precisión de caracteres, y opera tanto en Linux como en Windows. El código de programación está incluido en la versión de código abierto.

Code license: Open source, Apache License
Last updated: 27 Jan 2016

Google Docs is an online environment for editing and sharing documents, spreadsheets, presentations, forms, drawings, and tables. Google Docs documents can be public or private, or shared with anyone with a Google account, e-mailed, or downloaded in various formats, including conversions to PDF and other formats not identical to the original or to the proprietary format used at creation. Designated people with whom items are shared can be given permission to comment or edit the files, thus providing a quick way to collaborate on creating and editing documents and presentations.

Code license: Closed source
Last updated: 26 Jan 2016

TwapperKeeper is now called Hootsuite Archives and can be accessed from within Hootsuite.

Code license: Closed source
Last updated: 13 Dec 2015

CulturalAnalytics es una paquete R que contiene funciones para realizar análisis estadísticos y esquematizaciones de las propiedades de imágenes, entre las que se incluyen estadísticas como la desviación estándar en los espacios de colores RGB y HSV, entropía de la imagen y histogramas en escala de grises (intensidad) y color, y esquematización de nubes de colores y diagrama de dispersión de imágenes.

Code license: Open source, GNU GPL
Last updated: 12 Nov 2015

Map Warper es una herramienta para alinear ("rectificar") digitalmente mapas históricos para que concuerden con la precisión de los mapas actuales. La biblioteca pública de Nueva York la utiliza en la participación colectiva para la georrectificación de su propia biblioteca de mapas históricos digitalizados.
En la versión superior desarrollada por Tim Waters, los mapas provistos por el usuario se pueden georrectificar para que se usen en los proyectos de mapeo de todos los usuarios.

Code license: Open source
Last updated: 16 Jul 2015

VoxcribeCC ofrece la tecnología de reconocimiento de voz y de temas de escritorio más precisa. Se utiliza para la transcripción de medios audiovisuales y subtítulos de video.
Por favor vea el siguiente enlace para más información:
href='http://voxcribe.com/Video%20Speech%20Recognition%20Captioning%20Subtitli...' target='_blank'>VoxcribeCC Usage Video to learn using VoxcribeCC just in 2 minutes.

Code license: Closed source
Last updated: 16 Jun 2015

OxGarage es un sitio y un servicio REST diseñado para transformar documentos que presentan una amplia variedad de formatos. La mayoría de las transformaciones usan el formato de codificación de caracteres (Text Enconding Initiative) como formato pivote.
OXGarage está basado en Enrih Garage Engine desarrollado por Poznan Supercompting y Networking Center y Oxford University Computing Services para el proyecto ENRICH.
Consulte el siguiente vínculo para más detalles: conversion matrix

Code license: Open source
Last updated: 27 May 2015

Importar, transformar, almacenar e indexar datos tiene que ser fácil.

Catmandu provee una suite de módulos Perl para facilitar la importación, almacenamiento, recuperación, exportación y transformación de los registros de metadatos. Combina módulos con frameworks de aplicaciones web como PSGI/Plack, almacenes de documentos como MongoDB e índices a texto completo como Solr para crear un entorno de desarrollo rápido para servicios de biblioteca digital como repositorios institucionales y motores de búsqueda.

Code license: GNU GPL v3
Last updated: 22 Apr 2015

Praat is software for the phonetic analysis of speech, including support for articulatory and speech synthesis.

Code license: GNU GPL v2
Last updated: 19 Feb 2015

VARD 2 is an interactive piece of software produced in Java designed to assist users of historical corpora in dealing with spelling variation, particularly in Early Modern English texts. The tool is intended to be a pre-processor to other corpus linguistic methods such as keyword analysis, collocations and annotation (e.g. POS and semantic tagging), the aim being to improve the accuracy of these tools

Last updated: 19 Feb 2015

AGTK is a suite of software components for building tools for annotating linguistic signals, time-series data which documents any kind of linguistic behavior (e.g. audio, video). The internal data structures are based on annotation graphs. Annotation Graphs are a formal framework for representing linguistic annotations of time series data.

Code license: Open source
Last updated: 11 Feb 2015

Calibre is a free and open source ebook library management application, including options for syncing to devices and converting between a large number of formats. Calibre also has a built-in e-book editor for EPUB and AZW3 formats.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 29 Dec 2014

CHET-C, or Chapel Hill Electronic Text-Converter, is a browser based software tool designed to convert digital texts that employ standard epigraphic conventions such as the Leiden sigla into EpiDoc-compliant XML files.

The tool can be accessed online at http://www.stoa.org/projects/epidoc/stable/chetc-js/chetc.html. Fragments of epigraphic text using standard sigla (eg Leiden convention markup) are pasted into the tool and Epidoc compliant XML is generated.

Code license: Open source, GNU GPL
Last updated: 29 Dec 2014

HandBrake is an open-source, GPL-licensed, multiplatform, multithreaded video transcoder

Code license: Open source
Last updated: 29 Dec 2014

Insync extends Google Drive's web functionality to your desktop by integrating with Windows, Mac and Linux platforms. Insync allows for built-in sharing without a browser, multiple account support, on-demand shared file syncing, desktop notifications and more.

Code license: Closed source
Last updated: 29 Dec 2014

Best Media Converter for Mac to convert video or rip DVD to 160+ formats, burn to DVD, download online video, and share to YouTube easily.
Features:

  • Convert video/audio files and rip DVD to 160+ formats including 4K Ultra HD
  • Burn video to DVD disc, DVD folder and ISO files
  • Batch download streaming videos from 50+ popular Websites
  • Share to YouTube with a pop-up login window instantly
Code license: Closed source
Last updated: 29 Dec 2014
CSV
Subscribe to Conversion