La tecnología detrás del DataRefiner: Open Refine
Nuestro DataRefiner se basa en el software OpenRefine al que se le han añadido un conjunto de extensiones para trabajar con la plataforma.
Open Refine es una herramienta Java open-source (licencia BSD-3) basada en Java que con un interfaz web al estilo Excel permite cargar datos provenientes de diferentes sitios y en diferentes formatos, entenderlos, limpiarlos, conciliarlos y mejorarlos.
Primero hay que avisar que el concepto de OpenRefine es que puedas hacer las transformaciones desde tu propio ordenados, sólo que en lugar de usando una aplicación cliente rico lo hagas desde tu navegador (aunque como siempre, hay formas de llevarse este concepto al Cloud).
OpenRefine se encuentra en github: OpenRefine
Para encontrar más información podéis acceder a su wiki: https://github.com/OpenRefine/OpenRefine/wiki/Documentation-For-Users
Un poco de Historia
Cuando Google cedió el software a la comunidad le costó arrancar, para que os hagáis una idea:
https://github.com/OpenRefine/OpenRefine/releases
AÑO | VERSIÓN | DETALLES |
2013 | Google Refine 2.5 | Última versión con Branding de Google |
2015 | Open Refine 2.6-RC1 | Tardan 2 años en generar una Release Candidate de la que no salió versión final |
2017 | Open Refine 2.7 Release Open Refine 2.8 Release | Por fin tenemos una release, bueno 2 |
2018 | Open Refine 3.0 Release Open Refine 3.1 Release | Han pasado 5 años hasta que haya una versión major de Open Refine |
2019 | Open Refine 3.2 Release |
|
2020 | Open Refine 3.3 Release |
|
La versión actual es la 3.4.1 (sacada a finales de septiembre de 2020.
Como se puede ver desde 2018/2019 se nota que el proyecto se ha reactivado.
Cómo instalar OpenRefine
Como hemos dicho OpenRefine está pensado para usarse en el PC local, por lo que para usarlo basta con que descarguéis la distribución para vuestro sistema operativo.
En la página de releases encontraréis los instaladores para cada uno: https://github.com/OpenRefine/OpenRefine/releases/tag/3.4.1
Una vez descargado el software y lanzado el ejecutable se os abrirá un navegador en http://127.0.0.1:3333 con este aspecto: