En Q2 de 2022 trabajaremos en la integración de una herramienta de labeling de datos que permite que se pueda la Release 4.2.0 de Plataforma se ha integrado un motor de etiquetado de datos, que permitirá etiquetar la información almacenada en plataforma, concretamente en base a los DataSets ficheros (almacenados en el FileRepository o MinIO de Plataforma) o las Entidades almacenadas en los repositorios de plataforma.
Para esto se ha elegido integrar integradp la herramienta Label Studio.
Label Studio es una herramienta open-source de etiquetado de datos. Permite etiquetar tipos de datos como audio, texto, imágenes, vídeos y series temporales con una interfaz de usuario sencilla y luego exportar a varios formatos de modelos.
Se puede utilizar para preparar los datos en bruto o mejorar los datos de entrenamiento existentes para obtener modelos ML más precisos.
La imagen da una idea de cómo funciona Label Studio:
https://raw.githubusercontent.com/heartexlabs/label-studio/master/images/annotation_examples.gif
...
Sus principales características son:
...
Etiquetado incremental: comenzando con un pequeño número de atributos y añadiendo más con el tiempo.
Amplia comunidad en Github: https://github.com/heartexlabs/label-studio#install-for-local-development
Múltiples formas de instalarlo: incluyendo despliegue en proveedores Cloud
- Deploy in a cloud instance