domingo, 11 de septiembre de 2011

OPCIONES DE BÚSQUEDA Y HERRAMIENTAS DE BUSQUEDA

OPCIONES DE BUSQUEDA 
En general todos los sistemas de recuperación de información (se presenten en
forma de lenguaje de comandos, por menús o en formularios) permiten realizar
diferentes modalidades de búsqueda:


Búsqueda directa: se teclea directamente una o varias palabras en el
espacio reservado para ello por el sistema de interrogación en la base de datos.
Pueden distinguirse a su vez dos tipos dentro de esta modalidad:
-  Interrogación en texto libre: el usuario realiza su consulta sin tener
en cuenta la estructura de campos de los registros de la base de datos.
Generalmente, el sistema busca el término o los términos solicitados en
la totalidad de los campos de la base. En algunas bases de datos esta
búsqueda se realiza solamente en determinados campos, aquellos que el
administrador de la misma ha establecido.


-  Interrogación en texto libre: el usuario realiza su consulta sin tener
en cuenta la estructura de campos de los registros de la base de datos.
Generalmente, el sistema busca el término o los términos solicitados en
la totalidad de los campos de la base. En algunas bases de datos esta
búsqueda se realiza solamente en determinados campos, aquellos que el
administrador de la misma ha establecido.


-  Interrogación en campos individuales: el usuario realiza su consulta
directamente sobre el campo o campos que ha seleccionado
previamente: autor, revista, descriptores, etc...


-  Búsqueda a través de índices: en vez de teclear un término, el usuario
visualiza un diccionario o índice alfabético de las entradas de todos los campos o de
uno concreto (índice de autores, descriptores,...) y selecciona las más adecuados a
su búsqueda. El proceso puede parecer más lento pero es más seguro, ya que la
búsqueda se adapta mejor al contenido real de los registros de una base de datos.



En esta posibilidad hay que tener en cuenta si el sistema trabaja con uno o varios
índices y cómo se realizan los mismos:
-  Índices por palabras: incluyen solamente unitérminos (conceptos
expresados en una sola palabra). Se elaboran, por ejemplo, con todas las
palabras extraídas del título o  del resumen de los documentos. La
mayoría de los productores de bases de datos establecen una lista de
“palabras vacías” (preposiciones, artículos,...) para reducir el tamaño de
estos índices. Los términos presentes en esta lista de palabras vacías no
serán consultables.


-  Índices por frase: incluyen entradas compuestas por varias palabras. Por
ejemplo: apellidos y nombre del autor, descriptores o encabezamientos
de materias,...


- Búsqueda jerarquizada: la interrogación se realiza a través de una
estructura jerárquica. Es decir, a partir de un concepto genérico se pueden
localizar, no sólo los registros en los que aparece dicho término, sino además todos
aquellos en los que figure algún concepto más específico de su campo semántico.
Está opción de búsqueda sólo será posible en aquellos sistemas de información que
cuenten con campos codificados o que utilicen lenguajes estructurados
jerárquicamente en la clasificación o en los descriptores.

- Búsqueda a través de códigos: en determinados campos de algunas

bases de datos la interrogación no se realiza a través de un texto sino a través de
códigos numéricos o alfanuméricos. Pueden ser campos codificados la clasificación,
el idioma, la tipología documental,...

HERRAMIENTAS DE BÚSQUEDA


Para realizar una búsqueda compleja en una base de datos es preciso utilizar un
número elevado de conceptos. Hay que precisar los diferentes aspectos temáticos
implicados y además contar con la posibilidad de que cada uno de ellos pueda estar
expresado de diferentes maneras (sinónimos, temas relacionados,...). Los sistemas
de recuperación de información cuentan con diferentes herramientas para construir
una estrategia y relacionar de forma clara los diferentes términos utilizados en una
búsqueda.



  • Operadores lógicos o booleanos. Permiten la combinación de conceptos

en una misma búsqueda. Los sistemas de recuperación utilizan las operaciones
propias de la teoría de conjuntos o álgebra de Boole:
-  Suma o unión  (A or B, A o B): selecciona todos los registros en los que
aparece tanto A como B como ambos a la vez.
-  Resta o negación (A and not B, A no B): selecciona sólo los registros en los
que se encuentre el término A sin estar acompañado del término B. Es una
operación que debe realizarse con la máxima precaución para no dejar de
seleccionar documentos que sí pueden ser de interés para la consulta
deseada.
-  Intersección (A and B, A y B): selecciona solamente los registros en los que
aparece simultáneamente los conceptos A y B.
-  Algunos sistemas permiten también la operación contraria: A xor B:
registros donde está A o B pero no A y B simultáneamente.



  • Operadores sintácticos, de proximidad o de adyacencia.

Frecuentemente el operador de intersección (and) no es suficiente para precisar
una búsqueda. Por ejemplo, si se desea  localizar registros que traten sobre el
escritor ‘Juan Madrid’ la expresión ‘Juan and Madrid’ dará como resultado todas las
referencias en las cuáles aparecen ambos términos pero no necesariamente
relativos a este autor. Para mejorar la pertinencia de la búsqueda, los sistemas de
recuperación de información incorporan frecuentemente la posibilidad de combinar
conceptos relacionados entre sí por criterios sintácticos: presencia en la misma
frase, el mismo párrafo o el mismo campo, aparición en determinado orden o con
una separación mínima de palabras entre ellas, etc.
Por ejemplo, si se selecciona el operador de  búsqueda por frase y se teclea la
expresión ‘Juan Madrid’ el sistema seleccionará sólo aquellos documentos en los
que estas dos palabras aparezcan juntas y en este orden. Este tipo de operadores
son especialmente necesarios cuando se interroga sobre campos con textos
extensos (resumen o incluso el texto del documento completo)



  • Truncado: permite la interrogación conjunta de conceptos que comparten

una misma raíz. Mediante un signo de truncado (*, ? o $, según el programa) los
sistemas de recuperación permiten realizar una búsqueda conjunta de todas las
palabras de un índice que comparten un mismo comienzo o raíz.



  •  Operadores numéricos y de rango. En campos numéricos el sistema de

recuperación puede permitir la búsqueda de todos los valores mayores o menores a
una cifra o comprendidos en un intervalo determinado.
Por ejemplo, si se desea localizar solamente documentos publicados a partir de
1995, habrá que seleccionar en el campo año de publicación  los valores mayores
que esta cifra o bien utilizar la expresión 1995:1999 si se prefiere acotar un
periodo.
La existencia de esta opción en los sistemas de recuperación facilita la consulta en
los campos de carácter numérico (número de registro, año de publicación, códigos
de clasificación, periodo histórico,...)



  • Acotar o limitar conjuntos. La interrogación se ejecuta sólo sobre los

registros resultado de una búsqueda anterior, en lugar de sobre toda la base de
datos.

ESTRUCTURA DE UNA BASE DATOS DOCUMENTAL



Las bases de datos se componen de diferentes registros con su correspondiente número de identificación. En una base de datos bibliográfica cada registro se corresponde con una referencia de un documento original, que puede ser una publicación independiente (monografíatesisinforme,...) o una parte con autonomía de contenido dentro de otra publicación (artículo incluido en una revista, una serie o una compilación, ponencia comunicación en las actas de una reunión científica,...)
La información contenida en cada registro bibliográfico se estructura en diferentes campos para facilitar su control sistemático y su recuperación individualizada.
Algunos campos reflejarán la descripción formal del documento y otros van destinados a reflejar su contenido temático. Según el modelo de base de datos y el tipo de documentos vaciado en la misma se establece una estructura de campos particular.
Por ejemplo, en una base de datos donde se incorporan referencias de artículos de revista se encuentran campos como los siguientes:
Autor o autores del documento original.
Título del artículo.
Título de la revista en la que aparece.
Año de publicación.
Datos fuente: volumen, número, páginas.
Idioma en el que está escrito el documento.
Clasificación que describe el tema central tratado en el documento.
Palabras clave que caracterizan cada uno de los temas tratados con suficiente relevancia en el artículo
Resumen: texto breve que sintetiza el contenido del documento.

BASE DE DATOS DOCUMENTALES

Una SGBDD (Sistema de Gestión de Bases de Datos Documentales) se ocupa de la gestión de documentos optimizando el almacenaje y facilitando su recuperación. A diferencia de cualquier otro SGBD, un SGBDD no realiza ningún tratamiento sobre la información. Simplemente la almacena y posibilita su recuperación.


Por ejemplo:





Una de las principales herramientas que necesita el historiador que pretende usar el ordenador para recopilar información, ordenarla, clasificarla y poner a punto el material con el que desarrollar una obra es una base de datos documental o un gestor de conocimiento. No existen programas gratuitos que cumplan esta función adecuadamente, pero quizás el que más se le acerca es la aplicación CDS-ISIS, también conocida en su versión Windows como Winisis, hecha por la UNESCO. Aunque se desarrolló principalmente como base de datos bibliográfica, también se puede usar como base de datos documental. Es de manejo difícil, pero existe abundante documentación.







 El software Micro CDS/ISIS, (Computarized Documentation System - Integrated Set for Information System), también conocido como MicroISIS, es un sistema generalizado de almacenamiento y recuperación de información, basado en menús, diseñado especialmente para el manejo computarizado de bases de datos no numéricas, es decir, bases de datos constituídas principalmente por texto. En términos generales se puede pensar en una base de datos CDS/ISIS como un archivo de datos relacionados generados para satisfacer los requerimientos de información de los usuarios.

viernes, 9 de septiembre de 2011

TIPOLOGIAS BASES DE DATOS

TIPOLOGIA DE LAS BASES DE DATOS DOCUMENTALES
Se pueden establecer diferentes tipologías para caracterizar los diferentes modelos de
bases de datos documentales. Aquí se han establecido cinco clasificaciones
alternativas:
− Según el organismo productor.
− Según el modo de acceso.
− Según su cobertura temática y el destinatario.
− Según su cobertura documental.
− Según el modelo de tratamiento documental.
Las tres primeras son aplicables a cualquier tipo de base de datos, mientras
que las otras dos son específicas de las bases de datos documentales.

TIPOLOGÍA DE LAS BASES DE DATOS SEGUN EL ORGANISMO
PRODUCTOR
  •  Bases de datos de organismos públicos y de la administración: Las
bibliotecas y centros de documentación de los ministerios, instituciones públicas,
universidades y organismos públicos de investigación elaboran gran cantidad de
recursos de información. Estos sistemas pueden ser:
- Bases de datos de acceso público, sean gratuitas o no.
- Bases de datos de uso interno, con información de acceso restringido.





  •  Bases de datos de instituciones sin ánimo de lucro: Fundaciones,
asociaciones, sindicatos y organizaciones no gubernamentales elaboran
frecuentemente sus propios sistemas de información especializados.



  •  Bases de datos de entidades privadas o comerciales: Los centros de
documentación, bibliotecas y archivos de las empresas pueden elaborar distintos tipos
de sistemas de información:
- Bases de datos de uso interno para facilitar la circulación de información
dentro de la empresa
- Bases de datos de uso interno que ocasionalmente ofrecen servicio hacia el
exterior (usuarios particulares u otras instituciones).
- Bases de datos comerciales, diseñadas específicamente para ser utilizadas
por usuarios externos.


  •  Bases de datos realizadas por cooperación en red: Se trata de sistemas
de información cuya elaboración es compartida por diversas instituciones.. La información especializada en Internet. Madrid: CINDOC, 2001 bases de datos internacionales se elaboran a través de este sistema de trabajo, con diversos centros nacionales responsables de la información perteneciente a cada país.



  • TIPOLOGÍA DE LAS BASES DE DATOS SEGÚN EL MODO DE ACCESO
  •  Bases de datos de acceso local. Para consultarlas es necesario acudir al
organismo productor, a su biblioteca o centro de documentación. Pueden ser
consultables en monopuesto o en varios puntos de una red local.



  •  Bases de datos en CD-ROM. Pueden adquirirse por compra o suscripción
bien directamente por un particular o por una biblioteca o centro de documentación
que permita su consulta a sus usuarios. En algunas instituciones se instalan diferentes
CD-ROM en una red local para permitir su consulta desde cualquier ordenador
conectado a la misma.
  •  Bases de datos en línea. Pueden consultarse desde cualquier ordenador
conectado a través de un modem a la línea telefónica o a través de un servidor a
Internet. La consulta puede ser libre (gratuita) o exigir la solicitud previa de un clave
personal de entrada (denominada comúnmente con el término inglés password). Para
obtener un password puede exigirse la firma de un contrato.


  •  TIPOLOGÍA DE LAS BASES DE DATOS SEGÚN SU COBERTURA TEMÁTICA  Bases de datos científico-tecnológicas: contienen información destinada a
los investigadores de cualquier ámbito científico o técnico. A su vez, este grupo puede
dividirse en:
- Bases de datos multidisciplinares: abarcan varias disciplinas científicas o
técnicas.
- Bases de datos especializadas: recopilan y analizan documentos
pertinentes para una disciplina o subdisciplina concreta: investigación
biomédica, farmacéutica, química, agroalimentaria, social, humanística,
etc.
  •  Bases de datos económico-empresariales: contienen información de
interés para empresas, entidades financieras,..
  • Bases de datos de medios de comunicación: contienen información de
interés para los profesionales de medios de comunicación de masas: prensa, radio,
televisión,...
  •  Bases de datos del ámbito pólitico-administrativo y jurídico: contienen
información de interés para los organismos de la administración y los profesionales del
Derecho: legislación, jurisprudencia,...
  •  Bases de datos del ámbito sanitario: además de las propias del primer
grupo especializadas en ciencias de la salud, existen otros sistemas con información
de interés sanitario: historiales médicos, archivos hospitalarios,...
  •  Bases de datos para el gran público: contienen información destinada a
cubrir necesidades de información general, de interés para un gran número de
usuarios.
  •  TIPOLOGÍA DE LAS BASES DE DATOS SEGÚN SU COBERTURA
DOCUMENTAL

  •  Bases de datos centradas en un único tipo de documento. Su objetivo

es recopilar y permitir la localización de un tipo documental muy concreto. Hay bases
especializadas en patentes, tesis doctorales, informes, artículos de revista,...
Como ejemplos de este modelo pueden citarse:
- La base de datos NTIS (National Technical Information Service),
especializada en documentos técnicos oficiales de Estados Unidos), que
puede consultarse en http://www.ntis.gov o en
http://library.dialog.com/bluesheets/html/bl0006.html
- Las bases de datos especializadas en tesis doctorales, Dissertation
Abstracts (de carácter internacional, cuya descripción puede consultarse
en http://library.dialog.com/bluesheets/html/bl0035.html) o Teseo (tesis
españolas, consultable en http://www.mcu.es/TESEO/index.html).



  • Bases de datos que reúnen varios tipos de documentos. Su objetivo es

dar información sobre una disciplina, incorporando para ello diferentes tipologías
documentales.
Como ejemplo de este modelo puede citarse la base de datos ERIC,
especializada en una temática concreta (Educación) sobre la cual recoge referencias
bibliográficas de artículos, monografías, informes, tesis... Puede consultarse en
http://askeric.org/Eric/ o en http://library.dialog.com/bluesheets/html/bl0001.html

  •  TIPOLOGÍA DE LAS BASES DE DATOS SEGÚN EL MODELO DE

TRATAMIENTO DOCUMENTAL

  •  Bases de datos de sumarios o sin análisis de contenido: se componen

de referencias bibliográficas sencillas, en las cuáles el productor se limita a grabar
los datos de la propia fuente y no realiza ningún análisis del contenido. Incorporan
solamente los datos descriptivos fundamentales para localizar el documento,
presentes en el sumario: autor, título y datos de la fuente. En ocasiones pueden
incorporar el resumen editado con el propio documento original, generalmente
elaborado por el propio autor. En la mayoría de estas bases de datos la búsqueda
por materias sólo puede realizarse a través de las palabras del título del artículo. En
muchas áreas temáticas los títulos pueden resultar poco significativos. Los
resultados obtenidos en una búsqueda tienen cierta pertinencia, pero la escasez de
puntos de acceso para la búsqueda por materias no garantiza la exhaustividad.
Como ejemplos de este modelo pueden citarse las bases:
− Currents Contents del Institute for Scientific Information
http://www.isinet.com/isi/products/index.html
http://library.dialog.com/bluesheets/html/bl0440.html
− Uncover de la Universidad de Tennessee
http://www.lib.utk.edu:90/uncover
http://library.dialog.com/bluesheets/html/bl0420.html)
− Article@INIST
http://services.inist.fr/public/fre/conslt.htm
− Compludoc
http://www.ucm.es/BUCM/complu/frame.htm
Por la similitud de contenido, podrían incluirse dentro de este modelo los servicios
de suscripción a revistas electrónicas establecidos por empresas de distribución de
publicaciones periódicas, como por ejemplo el servicio SWETSCAN
(http://www.swetsblackwell.com/custss-about.htm).
3.5.2. Catálogos de bibliotecas: Son bases de datos que responden estrictamente
a los fondos contenidos en una biblioteca o en una red de bibliotecas (catálogos
colectivos). Tienen una alta homogeneidad, gracias a la aplicación de normas
internacionales de Catalogación. En estos sistemas se puede garantizar la búsqueda
por ejemplar conocido. Por el contrario, la búsqueda por materias es en ocasiones
dificultosa y con algunas variaciones entre diferentes catálogos. Puede realizarse a
través de la clasificación o de los encabezamientos de materias.
Como ejemplos de este modelo puede destacarse en España el Catálogo de la
Biblioteca Nacional Ariadna (http://www.bne.es/esp/cat.htm) y los



RODRÍGUEZ YUNTA, Luis. Bases de datos documentales: estructura y uso. En: MALDONADO,
Ángeles (coord.). La información especializada en Internet. Madrid: CINDOC, 2001