search

What kind of data should the tool work with?

HEURIST es un sistema de gestión de bases de datos diseñado específicamente para datos de Humanidades. Cualquier investigador capacitado puede diseñar, crear, gestionar, analizar y publicar su(s) propia(s) base(s) de datos(s) bien estructurada(s) a través de una sencilla interfaz web, sin programadores ni consultores. Se puede empezar con el diseño de una base de datos nueva en minutos y de una aplicación completa en algunas horas, utilizando el servicio en línea gratuito alojado en el Centro de Datos de la Universidad de Sydney.

Code license: Open source, GNU GPL, GNU GPL v3
Last updated: 13 Oct 2018

This is a Windows program for generating and searching a KWIC concordance of a document ("KWIC" = "Keywords in Context"). A KWIC concordance is a list of the different words occurring in the document, with each instance of each word shown in context (that is, within a phrase). Word frequency is shown. Context size is user-definable, anything from 3 to 19 words long. The software acts on text files and on MS Word docx files, skipping over "stop" words. The concordance can be displayed alphabetically or by frequency, and can be written to a file.

Code license: Closed source
Last updated: 3 Feb 2017

BASE (Bielefeld Academic Search Engine) is a search engine for academic open access web resources that searches materials stored in OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) enabled repositories.

Last updated: 19 Apr 2016

Beautiful Soup is a library, written in the Python programming language, for pulling specific pieces of data out of HTML and XML files. It is especially suitable when working with data files that aren't well-formed, or are otherwise difficult to parse.

Saves programmers hours or days of work on quick-turnaround screen scraping projects.

Last updated: 19 Apr 2016

Superfastmatch está diseñado para encontrar duplicados exactos de cadenas de texto entre documentos.

Code license: Open source, GNU GPL
Last updated: 1 Dec 2015

Voyeur es un entonro de análisis de texto basado en la web en el cual los usuarios pueden aplicar una amplia variedad de herramientas a cualquier texto que importen.

Last updated: 3 Nov 2015

El programa MONK workbench provee 525 obras de la Literatura de América del siglo XVIII y XIX y 37 obras de teatro y 5 obras de poesía escritas por William Shakespeare, junto con herramientas que permiten la investigación literaria a través del descubrimiento, el análisis y la visualización de patrones.

Last updated: 12 Aug 2015

Philologic se encarga de la búsqueda de textos integrales, y de la recuperación y del análisis de herramientas que pueden utilizarse con programas como TEI-Lite XML/SGML, Unicode, plaintext, Dublin Core/HTML y DocBook.

Code license: GNU GPL, Open source
Last updated: 9 Aug 2015

iBoogie es un motor de búsqueda de clustering que relaciona documentos con contenido similar o con temas relacionados con un mismo grupo. A cada grupo se le asigna una etiqueta basada en el contenido de los documentos. Los resultados se presentan al usuario en una jerarquía de temas (clusters) para la navegación.

Last updated: 3 Aug 2015

SearchTeam es un motor colaborativo de búsqueda que permite a los individuos y grupos para curar resultados de búsqueda en un SearchSpace público o compartido.

Code license: Closed source
Last updated: 1 May 2015

CorpusSearch 2 allows users to construct and search syntactically annotated corpora, including finding and counting lexical and syntactic patterns, correcting systemic errors, and coding linguistic features.

The software is released under Mozilla Public License 1.1 (MPL 1.1) .

Code license: Open source
Last updated: 11 Feb 2015

HyperPo is a user-friendly text exploration and analysis program that allows users to import texts or use texts available online (in English or French), and provides frequency lists of characters, words and series of words, color-coding to indicate repetition, KWIC, co-occurrence and distribution lists, and the ability to simultaneously compare data from multiple texts.

Last updated: 29 Dec 2014

Lextec offers a range of services and software for full-text indexing search and retrieval; automatic classification, routing, and filtering electronic text according to user defined profiles.

Last updated: 29 Dec 2014

Google Scholar searches books and scholarly articles (and optionally patents, legal opinions, and legal journals).

Last updated: 29 Dec 2014

Gathers smart search results based on user feedback. Similar to Google Alerts but you can give a thumbs up/down to improve the search results.

Last updated: 29 Dec 2014
CSV
Subscribe to search