Brasil: Software de Poli-USP ayudará en la selección de información sobre biodiversidad

Transformar el Big data en una herramienta útil para la Ciencia es el sueño de investigadores de todo el mundo. En Brasil, una de las propuestas en este sentido fue trabajada por el científico de la computación Allan Koch Veiga, en su doctorado en la Escuela Politécnica de la Universidad de São Paulo (Poli-USP). Desarrolló un marco que permitirá el desarrollo de software para facilitar la selección de información sobre biodiversidad recogida por científicos en las grandes bases de datos.

“Este marco es un marco conceptual utilizado para resolver un problema específico. En este caso, necesitábamos crear mecanismos que señalaran eventuales problemas de calidad para que la información pudiera ser gestionada de la mejor forma “, cuenta Veiga. El desafío no fue pequeño porque hace varias décadas investigadores de todo el mundo vienen almacenando y compartiendo información sobre biodiversidad. “Tenemos hoy algo en torno a 800 millones de registros de especies, digitalizados y puestos a disposición para que cualquier persona use”, cuenta.

En vista de este universo, el primer esfuerzo en la investigación de cómo esta información es compartida por la comunidad científica en las bases de datos. “La estandarización, sin embargo, no logra establecer la calidad de la información. Se define como se debe expresar el nombre científico de una especie, pero no indica o comprueba si el nombre introducido por el investigador en la base de datos está grabado correctamente “, ejemplifica. Se planteó, entonces, el verdadero desafío de la investigación.

El marco ya ha sido validado por Veiga. Parte de su doctorado se hizo en la Universidad de Harvard (EE.UU.), donde aplicó la innovación en una base de datos sobre biodiversidad. En ella, puede observar cuáles eran los datos de baja y alta calidad existentes en esa base de datos. Hoy hay una negociación en curso para que su marco sea implantado en el banco de datos sobre la biodiversidad de Brasil, el Sistema de Información sobre la Biodiversidad Brasileña (SiBBr).

La investigación de Veiga, titulada “El marco conceptual sobre la calidad de los datos de la biodiversidad” se llevó a cabo en el Centro de Investigación en Biodiversidad y Computación (Biocomp), grupo multidisciplinar con sede en Poli. Para estudiar el problema, Veiga dialogó con grupos de investigación de diversos países y se centró en la Global Biodiversity Information Facility (GBIF), un concentrador con sede en Dinamarca que concentra información de bancos de datos sobre biodiversidad de varios países. GBIF trabaja en asociación con otras organizaciones, como Biodiversity Information Standards (TDWG), responsable de crear los estándares sobre los datos de biodiversidad. El trabajo dio lugar a un artículo publicado en PLOS, que se puede leer en su totalidad aquí.

Fuente: Poli-USP