Las bases de datos son un elemento fundamental en el entorno informático
hoy en día y tienen aplicación en la práctica totalidad de campos. Concebidas
con un propósito general, son de utilidad para toda disciplina o área de
aplicación en la que exista una necesidad de gestionar datos, tanto más cuanto
más voluminosos sean estos. En nuestro ámbito particular de los SIG (Sistema de
Información Geográfico), los datos son cada día más voluminosos, debido no solo
a una mayor cantidad de información, sino también a una mayor precisión en
esta, la cual implica un mayor volumen de datos. Además, presentan otra serie
de características (uso múltiple, necesidad de acceso eficiente para análisis,
necesidad de indexación, etc.), haciendo todas ellas que sea recomendable el
uso de bases de datos y tecnologías específicas para su manejo.
El uso de las bases de datos en el ámbito SIG no ha sido siempre el
actual, hoy en día representan una parte clave para la gestión de los datos
geográficos, en especial dentro del marco de proyectos de cierta envergadura.
Aunque la realidad es que todavía se efectúa mucho trabajo SIG sin emplear
bases de datos (y las aplicaciones SIG así lo permiten, no siendo estrictamente
necesario disponer de una base de datos para almacenar la información), la
naturaleza propia de los proyectos SIG y la progresiva implantación de los SIG
a niveles más allá del uso personal traen ambas consigo un uso cada vez mayor
de las bases de datos, y por tanto una mayor necesidad de conocer el
funcionamiento de estas.
Aunque las particularidades de los datos espaciales con los que trabajamos
en un SIG han hecho necesarias modificaciones y adaptaciones sobre el esquema
de trabajo de las bases de datos genéricas, en esencia los fundamentos de estas
siguen constituyendo el elemento primordial sobre el que la arquitectura de
gestión de datos espaciales se apoya, y es necesario conocerlos con cierto detalle.
En esta sección, veremos de forma introductoria esos fundamentos de bases de
datos genéricas, aplicables a cualquier otro ámbito además del de los SIG, para
posteriormente poder tratar el caso particular de los datos espaciales. Para el
lector interesado en profundizar en el tema, una referencia libre y en español
con información extensa y detallada sobre bases de datos genéricas es [basesDatosUOC].
Entendemos como Base de Datos un conjunto de datos estructurado y
almacenado de forma sistemática con objeto de facilitar su posterior
utilización. Una base de datos puede, por tanto, constituirse con cualquier
tipo de datos, incluyendo los de tipo puramente espacial (geometrías, etc.)
tales como los que se utilizan en un SIG, así como, por supuesto, datos
numéricos y alfanuméricos como los que constituyen la componente temática de la
información geoespacial. Los elementos clave de la base de datos son esa
estructuración y sistematicidad, pues ambas son las responsables de las
características que hacen de la base de datos un enfoque superior a la hora de
gestionar datos.
Imaginemos, por ejemplo, el caso de un ingeniero encargado de planear la
instalación de un tendido eléctrico a través de nuestra zona forestal de
ejemplo. Sin duda, deberá emplear datos tales como Modelos Digitales de
Elevaciones, capas de zonas protegidas o capas de arbolado para establecer el
trazado óptimo y estimar costes de la línea, entre otras tareas. Si en una
situación ideal este ingeniero estaría en comunicación con el gestor forestal y
ambos compartirían sus conocimientos dentro de un equipo multidisciplinar,
también en lo referente a los datos debería existir una comunicación igual que
implique, ente otras cosas, un uso compartido y convenientemente coordinado de
ellos. En otras palabras, los datos también tienen ese carácter
multidisciplinar y deben dejar de verse como algo propio de un uso particular,
para concebirse como un conjunto global del que se benefician muy diversos
usuarios.
Establecer un uso compartido de los datos en una situación como la
anterior no parece difícil, ya que simplemente se trata de dos profesionales
que realizan tareas relacionadas y que, de un modo u otro, van a tener un
contacto directo. El gestor forestal puede sencillamente dar una copia de sus datos
al ingeniero y este podrá trabajar después con ellos de forma independiente.
Aunque los datos con que trabajen son inicialmente los mismos, en realidad esta
práctica da lugar son dos copias aisladas que constituyen dos universos
distintos.
La situación real, sin embargo, es habitualmente mucho más compleja, y
utilizar un esquema de colaboración como el anterior puede ser imposible,
carecer por completo de sentido, o tener un buen número de consecuencias
negativas. A medida que aumenta el número de usuarios, resulta menos
recomendable que cada uno trabaje con sus propios datos y se los hagan llegar
entre ellos a medida que los necesitan (una realidad que, desgraciadamente, se
presenta con más frecuencia de lo recomendable). No debe olvidarse que un conjunto
más amplio de usuarios que trabajan de esta forma y son ellos mismos quienes
gestionan sus propios datos, implica directamente un número también más elevado
de aplicaciones informáticas y de formatos de archivo, complicando enormemente
el trabajo coordinado en cuanto el equipo tiene un tamaño medio.
Es probable además que existan usuarios dentro de una misma organización
(por ejemplo, un organismo público) que aunque requieran para su trabajo datos
similares, no tengan contacto alguno entre sí. Aunque los usuarios sean
independientes, sus datos no lo han de ser necesariamente, y en una situación
ideal deberían acudir a un repositorio único de datos del que cada cual tomaría
lo necesario, en lugar de basar su trabajo en un conjunto de datos fragmentado
y difícil de gestionar.
Pensemos ahora que el gestor forestal detecta un error en el trazado de
una de las vías y lo corrige. Esa corrección no estará disponible para los
restantes usuarios, que pueden a su vez efectuar modificaciones similares que
no redundarán en una mayor calidad de los datos con los que trabaja el gestor
forestal, ya que, pese a utilizar datos similares, trabaja con su propio
conjunto de datos. Incluso si en algún momento todos estos usuarios deciden
poner en común sus datos y unirlos, esta operación puede ser muy compleja o
incluso, como sucede frecuentemente, imposible de realizar. Por su parte, otros
usuarios pueden añadir una nueva variable temática, como por ejemplo un índice
de siniestralidad de la vía, el cual, si bien tal vez no resulte de utilidad
inmediata para muchos usuarios, en un futuro sí pudiera serlo. Una vez más,
estos nuevos datos no quedan a disposición del resto de usuarios, y en caso de
serlo, no lo hacen en conjunto con datos similares, sino como un dato aislado de
los restantes.
En definitiva, es complejo
gestionar de forma adecuada los datos en el momento en que estos alcanzan un
ámbito más allá de lo personal, y las prácticas más habituales basadas en una
gestión «manual» de un conjunto de ficheros no son una opción adecuada. La
solución para lograr esa necesaria gestión centralizada de los datos son las
bases de datos y también, como veremos más adelante, los sistemas gestores de
bases de datos, que representan la interfaz entre las bases de datos y los
distintos usuarios.
En base al ejemplo anterior,
podemos analizar algo más sistemáticamente las ventajas de una base de datos
frente a una gestión no organizada de los datos. Las ventajas de utilizar un
almacenamiento estructurado se aprecian en diversos puntos, ya que afectan no
solo a los datos sino también al propio uso que se hace de estos. Algunas
ventajas que afectan directamente a los datos son las siguientes:
·
Mayor independencia. Los datos son independientes de las aplicaciones que
los usan, así como de los usuarios.
·
Mayor disponibilidad. Se facilita el acceso a los datos desde contextos,
aplicaciones y medios distintos, haciéndolos útiles para un mayor número de
usuarios.
·
Mayor seguridad (protección de los datos). Por ejemplo, resulta más fácil
replicar una base de datos para mantener una copia de seguridad que hacerlo con
un conjunto de ficheros almacenados de forma no estructurada. Además, al estar
centralizado el acceso a los datos, existe una verdadera sincronización de todo
el trabajo que se haya podido hacer sobre estos (modificaciones), con lo que
esa copia de seguridad servirá a todos los usuarios.
·
Menor redundancia. Un mismo dato no se encuentra almacenado en múltiples
ficheros o con múltiples esquemas distintos, sino en una única instancia en la
base de datos. Esto redunda en menor volumen de datos y mayor rapidez de
acceso.
·
Mayor eficiencia en la captura, codificación y entrada de datos.
Esto tiene una consecuencia
directa sobre los resultados que se obtienen de la explotación de la base de
datos, presentándose al respecto ventajas como, por ejemplo:
·
Mayor coherencia. La mayor calidad de los datos que se deriva de su mejor
gestión deriva en mayor calidad de los resultados.
·
Mayor eficiencia. Facilitando el acceso a los datos y haciendo más
sencilla su explotación, la obtención de resultados es más eficiente.
·
Mayor valor informativo. Resulta más sencillo extraer la información que
los datos contienen, ya que uno de los cometidos de la base de datos es
aumentar el valor de estos como fuente de información.
Por último, los usuarios de la
base de datos también obtienen ventajas al trabajar con estas, entre los que
cabe citar:
·
Mayor facilidad y sencillez de acceso. El usuario de la base de datos se
debe preocupar únicamente de usar los datos, disponiendo para ello de las
herramientas adecuadas y de una estructura solida sobre la que apoyarse.
·
Facilidad para reutilización de datos. Esto es, facilidad para compartir.
De forma resumida, puede
decirse que la principal bondad de una base de datos es la centralización que
supone de todos los datos con los que se trabaja en un contexto determinado,
con las consecuencias que ello tiene para una mejor gestión, acceso o
estructuración de estos.
profeee eso es muy dificil
ResponderBorrar