viernes, 5 de enero de 2018

Trabajo destacado en el FORUM de base del AHPVC. Lista de Encabezamientos de materia: una propuesta de vocabulario controlado.
















Autoras: Lic. Damaris Pérez Martínez. (Especialista Principal)
            Técn. María de los Ángeles Castro González. (Esp. en archivística)
Centro: Archivo Histórico Provincial.
Correos: damarisp@ahp.vcl.cu y mariaa@ahp.vcl.cu

Resumen

El presente trabajo, persigue, a partir de las referencias conceptuales acercarse a los lenguajes documentales y  los vocabularios controlados en la indización de documentos archivísticos, como actividad intelectual perteneciente a la archivística como disciplina. Ello permite trabajar en la normalización de las materias para una mejor organización y gestión de la información en el Archivo Histórico Provincial de Villa Clara.
Se realiza una breve caracterización de la situación actual del trabajo de descripción archivística por el grupo de Procesos Técnicos de esta institución, así como sus proyecciones de trabajo.
Se propone una herramienta para la organización del conocimiento, a partir de la creación de un vocabulario controlado consistente en una Lista de materias, útil para la indización de los Fondos documentales que atesora el Archivo Histórico de Villa Clara durante las actividades de descripción y recuperación de la información por parte de los usuarios. La misma consiste en una lista abierta ordenada alfabéticamente en la que se establece una estructura que une los términos relacionados semánticamente, con el objetivo de reducir las ambigüedades semánticas, la homonimia y la sinonimia, cuyo fin es facilitar el trabajo de descripción archivística, la recuperación de la información y mayor calidad en la prestación de los servicios.


Introducción

Los documentos nacen del decursar humano, razón por la cual se usan administran y conservan; los archiveros son los intermediarios entre los documentos y los usuarios, es por ello que se hace necesario crear un lenguaje controlado como herramienta que permita una eficiente comunicación documental en el procesamiento archivístico, aliviando con ello los obstáculos que se puedan presentar a la hora de prestar los servicios solicitados por usuarios  e investigadores.
El Archivo Histórico Provincial de Villa Clara, como parte del Sistema Institucional de Archivos, tiene entre sus tareas la normalización archivística para realizar la descripción científico técnica de los Fondos y Colecciones por parte de los archiveros, a la vez que le permita crear sistemas de organización del conocimiento, como herramientas que sirven para organizar la información, gestionarla y recuperarla por los usuarios. Entre los especialistas  de la institución  ha existido un marcado interés por crear una herramienta de este tipo, no solo por estar a la par de otros centros que brindan servicios similares al nuestro, sino también porque la dinámica de las actividades lo exige para brindar un producto que satisfaga a los usuarios en general. Es por ello,  que entre las proyecciones de trabajo del Centro se ha previsto como una estrategia, la creación de un lenguaje controlado, a partir de considerarse esto una debilidad que aún persiste. Para dar repuesta a la siguiente problemática se plantea el siguiente sistema de objetivos:

Objetivo General

Proponer un vocabulario controlado, como herramienta de trabajo de alto valor agregado que facilita la gestión de la información.

Objetivos específicos  

·         Analizar aspectos teóricos conceptuales acerca de los vocabularios controlados         
·         Caracterizar el procesamiento científico técnico en el l Archivo Histórico Provincial de Villa Clara.
·         Proponer una Lista de Encabezamiento de Materias para realizar el trabajo de descripción archivística en el Archivo Histórico Provincial de Villa Clara.

Novedad de la investigación

Se pretende realizar el primer acercamiento a un sistema de lenguaje controlado para el Archivo Histórico Provincial de Villa Clara.


 Alcance de la investigación
Se pretende realizar la propuesta de lenguaje controlado teniendo en cuenta los fondos procesados por la Norma ISAD (G) en el Archivo Histórico Provincial de Villa Clara.

Tipo de investigación

Cualitativa (descriptiva).

Métodos y técnicas.

El método empírico, a través del Análisis documental clásico: se procede a la recuperación, estudio y revisión de la bibliografía relacionada con la temática, a fin de reunir la mayor cantidad de información que nos permita
Los métodos teóricos empleados son:
·         Método  Lógico Histórico: Con el fin de analizar los principales postulados del tema.
·         Método Sistémico: Aplicado para establecer los principales componentes de la Investigación y la relación que hay entre ellos.

 Desarrollo

1.  Aspectos teóricos conceptuales

1.1  Los vocabularios controlados.

Los lenguajes documentales han existido, desde que existen documentos escritos, como un método de clasificación, almacenamiento, búsqueda y recuperación de la información, por tanto desde Aristóteles (siglo IV a. C.) hasta las grandes clasificaciones de finales del siglo XIX y las desarrolladas  a lo largo de todo el siglo XX, la clasificación ha sido el método de indización por excelencia. Alrededor de los años 60 surgen los primeros tesauros y otras formas de vocabulario controlado, lo que supuso una verdadera revolución en el campo de la documentación y pocos años después, la utilización del lenguaje natural y los ordenadores son avances aún superiores. Los más recientes son la indización automática,  los sistemas expertos y los nuevos lenguajes que aportan una estructura semántica a los documentos.
La bibliografía consultada define el lenguaje o vocabulario controlado como las “listas de términos con un significado concreto que facilitan la búsqueda y recuperación de  la información’’[1]. Forma parte del lenguaje documental, su objetivo es mejorar la consistencia, legibilidad, traducibilidad y recuperación de información en documentos de carácter técnico y se producen teniendo en cuenta ciertas restricciones en cuanto a gramática, estilo y vocabulario. Su manejo debe ser sencillo y debe preservar la riqueza informativa de los documentos, evitando la ambigüedad. Ejemplos de vocabularios controlados son los glosarios, diccionarios, tesauros.
Para el control del vocabulario nos valemos de la indización que es una técnica del análisis documental para representar y describir el contenido de los documentos, mediante conceptos principales contenidos en ellos, con el fin de guiar al usuario en la recuperación de los documentos que necesita. “La INDIZACIÓN es parte del procesamiento, consiste en describir y caracterizar a un  documento con la ayuda de representaciones de los conceptos contenidos en él. Facilita la recuperación de información  para satisfacer  su demanda. Durante este proceso   se eligen aquellos términos más apropiados, ya sea por materias, personas, instituciones o lugares. Para los archiveros, son palabras que se vinculan al contenido del documento” [2]  y se les conoce como descriptores o puntos de acceso.

Los vocabularios controlados tienen sus ventajas, dadas por sus funciones fundamentales: tienden a reducir las ambigüedades semánticas, a mejorar la consistencia en la representación de la materia y a facilitar la realización de búsquedas amplias. La primera función se consigue diferenciando los distintos significados de los homógrafos, la segunda mediante el control de los sinónimos,  y la tercera estableciendo una estructura que una los términos relacionados semánticamente.
El vocabulario controlado es más práctico que las listas de vocabularios libres pues proporciona al usuario un punto de búsqueda, en vez de dos o más, y reduce la posibilidad de que la búsqueda sea incompleta. Sin embargo, entre sus desventajas tenemos que puede perderse alguna información.
Ya en el mundo moderno se habla de los sistemas de organización del conocimiento, se trata de  mecanismos que sirven para organizar la información, gestionarla y recuperarla ya sea fuera de la red o dentro de ella. También se puede diseñar un sistema de organización propio, basado bien en algún sistema normalizado ya establecido, o en un sistema hecho a medida e, incluso, puede combinar varios de estos sistemas (por ejemplo, utilizar la Clasificación Decimal Universal (CDU) junto con un tesauro o utilizar un esquema desarrollado para la Intranet corporativa local). De forma general, se pueden establecer 4 tipos principales de sistemas de organización del conocimiento:
·         Listas de términos: Ficheros de autoridades, glosarios, diccionarios, índices
·         Clasificaciones y categorías: Listas de encabezamientos de materia, Sistemas de clasificación, Taxonomías, Categorías Temáticas
·         Listas relacionadas: Tesauros:, Ontologías,  redes semánticas
·         Mapas de conocimiento.
1.1.1   Las Listas de Encabezamientos de Materias.

Las listas de encabezamientos de materia (LEM) son herramientas o método de indización para el control del vocabulario de los lenguajes documentales.
Se definen como “…. listas de términos controlados igual que los tesauros dispuestos en orden alfabético, donde se muestran las relaciones que han contraído los conceptos representados por tales términos, susceptibles de utilizarse en un índice, catálogo o base de datos para la descripción característica de las materias” [3] con la pretensión de eliminar o atenuar los riesgos derivados de la ambigüedad inherente al lenguaje natural. Es un lenguaje precoordinado de estructura asociativa o combinatoria que consiste en listas alfabéticas de palabras capaces de representar los temas de los que trata un documento, eliminándose con ello, la posibilidad de falsas combinaciones para dar precisión a la indización. Así la caracterización temática lleva implícita la síntesis del documento. Dicho con otras palabras: lo ideal es que un solo encabezamiento represente el contenido de los documentos en su totalidad, en lugar de realizar una selección más detallada de aquellos conceptos que sirvan para expresárnoslo.
El lenguaje de las LEM es un lenguaje sintético, exhaustivo que busca la captación global del tema que trata el documento; es un lenguaje utilizado para la indización de materias que no responden a una estructuración conceptual; son coordinados para que las materias se puedan ensamblar con el fin de ofrecer conceptos más específicos. Un ejemplo son las listas de encabezamientos de Materias de la Biblioteca del Congreso: Library of Congress Subject Headings (LCSH).
Las listas se componen de encabezamientos y subencabezamientos, los encabezamientos tienden a ser expresiones muy genéricas y no representan con precisión materias complejas o específicas, ello se logra con la inclusión de subencabezamientos para precisar la materia o delimitar su sentido. Se aplican con el fin de precoordinar conceptos, lo cual facilita la recuperación, pero no se deben de usar en exceso.
Es de vital importancia que los encabezamientos reúnan ciertos requisitos, para ello se han definido 5 principios:
·         Economía: evitar dar a un documento demasiados encabezamientos; tres son suficientes. Si el documento toca muchos temas específicos, se elige uno más genérico.
·         Especificidad: el término escogido debe representar la materia correcta de la que trata el documento. No deben asignarse a la vez dos epígrafes en la misma obra, uno general y el otro específico. Es importante en este principio tener en cuenta el nº de documentos de la colección.
·         Lingüístico: los términos deben pertenecer al idioma habitual y respetar el orden natural de las expresiones.
·         Uniformidad: cada materia tiene que ser siempre denominada de la misma manera. Cuando se produzca polisemia, será necesario precisar o eliminar la ambigüedad por medio de un modificador del sentido del encabezamiento.
·         Uso: las reglas deben establecerse en función de la institución y las necesidades del usuario, dependiendo así la elección de la terminología.
El control terminológico de los instrumentos de representación se logra a través del establecimiento de relaciones entre términos, como el envío simple (v., Véase – remite al término aceptado) y la explicación correlativa (con la simbología x que representa,  Usase por, que  procede al término no aceptado) para el control de sinónimos y equivalencias, o referencias de orientación (V. a., Véase además) que remiten a otros encabezamientos relacionados con el tema en cuestión. El control terminológico permite reducir los problemas relacionados con polisemia, sinonimia etc. para alcanzar un grado de homogeneidad aceptable, es decir, permite establecer las relaciones  de equivalencias, jerarquías y asociaciones.
2.    El Grupo de Procesos Técnicos del Archivo Histórico Provincial de Villa Clara.
El Grupo de Procesos técnicos del Archivo Histórico Provincial (AHP) determinó en su proyección estratégica, la confección de un lenguaje controlado ante la necesidad de crear una herramienta de trabajo que facilite el desempeño de los especialistas y técnicos durante la  descripción archivística. Esto beneficia a la institución con la creación de una herramienta de alto valor agregado que permita, por un lado, lograr una consistencia en el procesamiento científico técnico de fondos y colecciones y por otro, un eficaz instrumento para la recuperación de la información, lo que agilizará  los plazos de investigación de los usuarios que accedan a la Sala,  teniendo en cuenta que la nueva concepción de la normalización archivística necesita una mejor organización y descripción de los documentos para el acercamiento a nuestro valioso acervo documental. Por otro lado, está en perfecta consonancia con el diseño e implementación del Sistema de Gestión de la Calidad concebido en nuestro Centro.
Hasta el momento la institución contaba con un material impreso que contenía las materias indizadas durante el procesamiento de las Actas Capitulares que pertenecen al fondo Ayuntamiento de Santa Clara. Este material es el resultado de la informatización de los primeros tomos de esta Actas,  el mismo cuenta con deficiencias por ser la primera experiencia en la aplicación de la Norma ISAG G, por lo que nos planteamos una redefinición de las materias seleccionadas y trabajar en la confección de un vocabulario controlado que trate de lograr un acercamiento a lo que plantea la bibliografía  referente a la normalización archivística y a los métodos actuales del tratamiento documental, para lograr la recuperación de la información de la documentación que poseemos. 
3. Propuesta de Lista de Encabezamiento de Materia
La LEM que a continuación se propone tiene como base los conceptos seleccionados para el descriptor de materia durante la descripción de los fondos Ayuntamiento de Santa Clara (1690- hasta la primera década del siglo XIX), Registro de la Propiedad (1870- 1880), Registro General de Compañías Anónimas (1886-1980) y Anotadurías de Hipotecas (1749-1880). La misma constituye, como ya se expresó un primer acercamiento a esta compleja tarea de abordar los lenguajes documentales, por lo que su perfeccionamiento, completamiento, actualización, así como su futura automatización, son acciones indispensables para lograr que la institución cuente con un vocabulario controlado del acervo documental, que sirva, tanto para el trabajo de especialistas y técnicos, como para la prestación de servicios a usuarios.
3.1 Características
3.1.1  Forma de presentación:
Se trata de una lista de encabezamientos que cuenta con un total de 327 entradas, de las que 303 constituyen términos admitidos y 24 son referencias que conducen de un encabezamiento no admitido a otro admitido o viceversa.
3.2 .1 Componentes de cada entrada
Aparece presentada en orden alfabético ubicando a la derecha el control terminológico de aquellas que lo requieren, con el fin de evitar ambigüedades semánticas y establecer las relaciones de jerarquía y asociación. Ello se logra a través de la siguiente simbología entre los términos:
·         El envío simple (Véase) que remite al término aceptado. Ej. Arbitrio, v. impuesto.
·         Explicación correlativa (x) que procede al término aceptado. Ej. Impuesto x por arbitrio.
·         Control de sinónimos y equivalencias (véase además), que remite a otros encabezamientos relacionados con el tema en cuestión, es decir, cuando la relación es asociativa o, a su vez, jerárquica, ya sea por términos más generales o específicos, entonces ésta es una referencia general. Ej.  Arrendamiento, v a alquileres, asistencia social v. a beneficencia.
Cada encabezamiento admitido en mayúscula y marcado en negrita, se presenta acompañado de los siguientes datos:
1.    Notas que explican o delimitan el concepto y/o aclaran su uso, en caso de que sea necesario.
2.    Las relaciones semánticas, agrupadas y ordenadas alfabéticamente, que unen este encabezamiento con otros, expresadas por las siguientes referencias:
x- relaciona términos no aceptados,
v. a – se trata en realidad de una relación que puede ser jerárquica o asociativa, pero en vez de remitir a otros términos uno por uno, lo hace en forma general mediante una nota,
v. – remite de un término no aceptado al término aceptado.
3. Este conjunto de términos no aparece en todas las entradas, bien porque el propio encabezamiento no lo requiera o bien porque en la dinámica de construcción continuada no han sido todavía establecidos.
4.   Los términos no admitidos aparecen sin negrita con la referencia Véase, que envía al encabezamiento aceptado. En ocasiones desde un término no admitido se remite a más de un encabezamiento admitido con la simbología v, seguida de los términos que se proponen como alternativa. Ej.

PADRONES
            v CENSOS
Por otra parte, los términos admitidos que aparecen en negrita con la referencia x, relaciona términos no aceptados. También, desde un encabezamiento admitido nos pueden remitir a más de un término no admitido con la simbología correspondiente. Ej.
CENSOS
x AMILLARAMIENTO
              PADRONES
              REPARTIMIENTO VECINAL 
3.3. Ordenación
La ordenación de los encabezamientos es alfabética pura, no tiene por tanto en cuenta ni guiones, ni puntos, ni comas. A pesar de que esta ordenación no es la tradicional en las distintas listas de encabezamientos, se considera oportuno, no hacerla demasiado compleja por tratarse de una primera experiencia en este sentido (Véase anexo).

Conclusiones
Los vocabularios controlados se consideran como un conjunto limitado de términos utilizados para representar los temas presentes en recursos de información, los que están sujetos a algún tipo de estructura y se conectan a través de referencias o relaciones de equivalencia, jerarquía y asociación semántica.
Ha sido interés del Archivo Histórico Provincial de Villa Clara  en su proyección estratégica, lograr un acercamiento a la normalización archivística y a los métodos actuales del tratamiento documental.
La propuesta  de un vocabulario controlado por el Grupo de Procesos Técnicos, constituye un primer acercamiento a  la normalización de los términos en nuestra Institución, para facilitar, tanto el trabajo técnico de los archiveros, como el trabajo investigativo de los usuarios, al  facilitar la recuperación de los documentos  de una manera más ágil y veraz.
El perfeccionamiento, completamiento, actualización, así como su futura automatización, son acciones indispensables para lograr que la institución cuente un vocabulario controlado del acervo documental que atesora.
Bibliografía
·         OCLC. Caber Dewey. (on line). Disponible en: http://www.anthus.com/CyberDewey/CyberDewey.html
·         Thesaurus Builder.(on line).Disponible en: http://www.thesaurusbuilder.com/
·         Montero, Yusef Hassan; Núñez Peña, Ana. Diseño de Arquitecturas de Información: Descripción y Clasificación. (on  line).Disponible en : http://www.nosolousabilidad.com/articulos/descripcion_y_clasificacion.htm
·         Tipología del lenguaje documental (on line).Disponible en: http://www.eubca.edu.uy/diccionario/letra_l.htm.
·         Barite,  Mario. (2000) (on line).Disponible en:       http//www.verbiclara.nireblog.com
·         Amores, J. Gabriel. Sistemas de traducción automática (on line). Disponible en:
·         Salta, Gerardo; Cravero, Saloj; Celso, Gabriela. Lista de encabezamientos de materia de la Biblioteca del Congreso de los Estados Unidos: características generales.  Revista Cielo.(on line) Disponible en : http://www.scielo.cl/
·         Diccionario de la Lengua Española. Madrid, 1947.GIL URDICIAIN, Blanca (2004): Manual de Lenguajes Documentales. Gijón : TREA
·   VAN SLYPE, Georges (1991): Los lenguajes de indización. Madrid: Fundación Germán Sánchez Ruipérez.


Anexo

Lista de Encabezamiento de Materias.

A

ABASTO
                v ESTABLECIMIENTOS COMERCIALES
ABOGACÍA
                  v. a  ABOGADOS
ACADEMIAS
                       v. a ARTES Y OFICIOS
                              ESCUELAS
ACREDITACIONES
ACREEDORES: que tiene acción o derecho a pedir el cumplimiento de alguna obligación.
ACUEDUCTOS
ADJUDICACIONES: declarar que alguna cosa corresponde a una persona o conferírsela en satisfacción de algún derecho.
ADULTERIO
AGRADECIMIENTOS
AGRICULTURA
AGRIMENSURA
AGRESIONES
                      v .a  DESORDENES PUBLICOS
                               ASALTOS 
ALCALDES
ALCALDIAS
                     v. a AYUNTAMIENTOS
                             CABILDOS

ALIMENTOS
                     v. a COMERCIOS
                            VITUALLAS
                      x    ABASTO
ALQUILERES
                     v. a ARRENDAMIENTO
ALMACENES
ALUMBRADO PUBLICO
AMILLARAMIENTO
                              v CENSOS
ANIMALES
ANUNCIOS
APELACIONES
                         x RECURSO DE ALZADA
APICULTURA
ARANCELES: tarifa oficial que determina los derechos que se han de pagar en varios ramos como ferrocarriles, aduanas, etc.
                     v. a  IMPUESTOS
ARBITRIOS
                  v. IMPUESTOS 
ARMAMENTO
ARQUITECTURA
                            x CONSTRUCCIONES
                             v. a  EDIFICIOS
                                     CONTRUCCION
                                     OBRAS PÚBLICAS       
ARRENDAMIENTO: contrato por el cual se arrienda, precio en se arrienda.
                                v. a  ALQUILERES
ARTES Y OFICIOS
                               v. a  ACADEMIAS
                                       ESCUELAS
ASALTOS
                v. a AGRESIONES
                       DESORDENES PUBLICOS
ASEGURACIONES
ASEGURAMIENTO
                              x ABASTO
v. a  VITUALLAS
        COMERCIOS
         VIVERES
ASILOS                                                  
             v. a ASISTENCIA SOCIAL
ASISTENCIA SOCIAL
                                   x BENEFICENCIA 
ASOCIACIONES
                           v. a CLUBES
                                    SOCIEDADES
AVALES
AYUNTAMIENTOS
                              v. a CABILDOS
                                     ALCALDÍAS
AZÚCARES
                                             
B

BAUTIZOS
BEBIDAS
BENEFICENCIA
                         v  ASISTENCIA SOCIAL
BIENES
            v. a BIENES MUEBLES
                   BIENES INMUEBLES
                   BIENES de PROPIOS
                   BIENECHURÏAS    
BOMBEROS
BONOS: tarjeta a modo de vale que se da de limosna para quien lo recibe lo canjeé por comestible u otros artículos de primera necesidad y a veces por dinero
             v. a DINERO
C

         
CAFE
CAMINOS
               v.  VIAS PÚBLICAS
CARCÉLES
CARGOS
CASAS
           v.    VIVIENDAS
CAUDALES: hacienda, bienes de cualquier especie y más comúnmente dinero
                   v. a DINERO
                          BONOS
CAUSAS JUDICIALES: referente a condenas establecidas por delitos cometidos.
CEDULAS PERSONALES: documento oficial que expresa el nombre, profesión domicilio y demás circunstancia de cada vecino.
                                         v. DOCUMENTOS de IDENTIDAD
CEMENTERIOS                  
CENSOS
               x AMILLARAMIENTO
                   PADRONES
                   REPARTIMIENTO VECINAL 
CEREMONIAS   
CESANTIAS
                    v. a DESTITUCIONES
CESIONES Y TRASPASOS
CLASES SOCIALES
                                 v. a ESCLAVITUD
CLUBES
              v. a ASOCIACIONES
COLGADIZOS
                       v  VIVIENDAS
COMADRONAS
COMBUSTIBLES
COMERCIO
                    v. a COMERCIO LÍCITO
                          COMERCIO ILICITO
                          COMERCIO MARITIMO
                           COMERCIANTES            
COMERCIOS: tienda o establecimiento comercial.
                      x  ABASTO
                      v. a  ESTABLECIMIENTOS COMERCIALES
COMPAÑIAS DE VOLUNTARIOS
                                                      v  EJERCITOS
                                                          TROPAS
                                                   
COMPRAVENTAS
COMUNICACIONES: úsese para referirse a correos, telégrafos, teléfonos.  
CONDECORACIONES
CONDOLENCIAS
CONGRATULACIONES: acción de felicitar a alguien
CONSEJOS DE GUERRA
CONTABILIDAD
                          v. a PRESUPUESTO
                                 GASTOS
                                  INGRESOS 
CONTAMINACIÓN AMBIENTAL
CONTRATOS
CONVENIOS
CORRALES
                   v. a TIERRAS
CRÉDITOS
CURAS   
            v. a PARRACOS
CUSTODIA
                 X TUTORES
                  X CURADORES
                  v. a.  TUTORIA de  MENORES   
                  
                  
D

DANNIFICADOS
DANOS
             v. a PERJUICIOS
DEBITOS
               v. a DEUDAS
DECORACIONES
DEFUNCIONES
DELITOS
DEMOLICIONES
DENUNCIAS
DEPORTES
DESALOJOS
DESASTRES NATURALES
                                            v. a HURACANES
DESORDENES PUBLICOS
                                            v. a ASALTOS
                                                   AGRESIONES
DESTITUCIONES
                            v. a CESANTIAS
              
DEUDAS
              v. a DEBITOS

Nota: La lista continúa hasta la última letra del alfabeto


[1] Manual de Indización.
[2]
[3] Listas de encabezamientos de materia y Thesauri en perspectiva comparada. Por José María Izquierdo ARROYO y Luis Miguel MORENO FERNÁND

No hay comentarios:

Publicar un comentario

LEGISLACIÓN ARCHIVÍSTICA: CONSTRUYENDO UNA TEORÍA

  M.Sc. Yorlis Delgado López Profesor asistente del Colegio de San Gerónimo de La Habana, Universidad de La Habana Asesor jurídico de ...