La tecnología detrás del DataRefiner: Open Refine

Nuestro DataRefiner se basa en el software OpenRefine al que se le han añadido un conjunto de extensiones para trabajar con la plataforma.

Open Refine es una herramienta Java open-source (licencia BSD-3) basada en Java que con un interfaz web al estilo Excel permite cargar datos provenientes de diferentes sitios y en diferentes formatos, entenderlos, limpiarlos, conciliarlos y  mejorarlos.

Primero hay que avisar que el concepto de OpenRefine es que puedas hacer las transformaciones desde tu propio ordenados, sólo que en lugar de usando una aplicación cliente rico lo hagas desde tu navegador (aunque como siempre, hay formas de llevarse este concepto al Cloud).

OpenRefine se encuentra en github: OpenRefine

Para encontrar más información podéis acceder a su wiki: https://github.com/OpenRefine/OpenRefine/wiki/Documentation-For-Users

Un poco de Historia

Cuando Google cedió el software a la comunidad le costó arrancar, para que os hagáis una idea:

https://github.com/OpenRefine/OpenRefine/releases

AÑO

VERSIÓN

DETALLES

2013

Google Refine 2.5

Última versión con Branding de Google

2015

Open Refine 2.6-RC1

Tardan 2 años en generar una Release Candidate de la que no salió versión final

2017

Open Refine 2.7 Release

Open Refine 2.8 Release

Por fin tenemos una release, bueno 2

2018

Open Refine 3.0 Release

Open Refine 3.1 Release

Han pasado 5 años hasta que haya una versión major de Open Refine

2019

Open Refine 3.2 Release

 

2020

Open Refine 3.3 Release

 

La versión actual es la 3.4.1 (sacada a finales de septiembre de 2020.

Como se puede ver desde 2018/2019 se nota que el proyecto se ha reactivado.

Cómo instalar OpenRefine

Como hemos dicho OpenRefine está pensado para usarse en el PC local, por lo que para usarlo basta con que descarguéis la distribución para vuestro sistema operativo.

En la página de releases encontraréis los instaladores para cada uno: https://github.com/OpenRefine/OpenRefine/releases/tag/3.4.1

Una vez descargado el software y lanzado el ejecutable se os abrirá un navegador en http://127.0.0.1:3333 con este aspecto: