IV. SISTEMA DE ARCHIVO Y B�SQUEDA DE INFORMACI�N

Por qu� viene el recuerdo
�ste y no otro
si nada nunca
lo llama lo repite lo convoca
�ste y no otro
�ste
BENEDETTI

CON EL desarrollo de la sociedad aparece la necesidad de guardar cada d�a m�s cantidad de informaci�n. As� tenemos que en la actualidad una de las funciones m�s importantes de las computadoras es ayudar a la organizaci�n de la sociedad y al control de varios aspectos de �sta, mediante el almacenamiento y manejo de grandes bancos de datos.

Hace ya algunos a�os, la aparici�n de las m�quinas de oficina aceler� la rapidez del trabajo, pero trajo consigo problemas de car�cter diferente: se empez� a producir un n�mero de documentos cada vez mayor, de manera que se necesitaron m�s archiveros para almacenarlos. La gran cantidad de documentos hizo necesario idear un sistema de archivo adecuado al tipo de empresa u organizaci�n en cuesti�n. Por ejemplo, en una oficina se podr�a clasificar conforme a alguno de los siguientes criterios: por orden alfab�tico del nombre de las personas, por fechas de inicio de operaciones, por n�mero de registro, por orden cronol�gico de los sucesos, por temas, etc�tera, y la manera �ptima de organizar la informaci�n depende de los objetivos de la o las personas interesadas en el manejo de dicha informaci�n.

En un principio, esta informaci�n se guardaba "f�sicamente" en archiveros. M�s adelante muchas empresas utilizaron, por ejemplo, el sistema de microfichas, esto es, fotograf�as de tama�o reducido cuyos negativos sirven como archivo permanente; de esta manera era posible almacenar un archivo de 2 600 tarjetas de 7.5 cm x 12.5 cm en un rollo de 30 m de pel�cula de 16 mil�metros.

Posteriormente, con la aparici�n de las computadoras modernas, gran parte de la informaci�n extra�da de los documentos se pudo grabar en cintas o discos magn�ticos de acuerdo con un c�digo binario. En estas computadoras, la organizaci�n de la informaci�n se lleva a cabo de una manera muy similar a la requerida para archivar en gavetas. El tiempo de acceso a la informaci�n, y el espacio f�sico que ocupan, son en la pr�ctica las principales diferencias entre ambos medios de almacenamiento. Es por esto que, teniendo claras estas diferencias, en ocasiones hablaremos de manera indistinta de ambas formas de almacenar.

Las computadoras como nuevo medio de almacenamiento de datos, no sustituyen del todo a los sistemas de microfichas y archivos en papel. Sin embargo, han permitido un importante ahorro de espacio y una disminuci�n considerable en el tiempo de acceso a la informaci�n, con respecto a los medios utilizados anteriormente. Pero existe un problema: conforme aumenta la cantidad de informaci�n almacenada, se vuelve m�s dif�cil el acceso a �sta. La situaci�n se agrava cuando, debido a la naturaleza de la informaci�n requerida, no existen m�todos eficientes para encontrar los datos requeridos en un tiempo corto. Por ejemplo, algunas corporaciones han invertido millones de d�lares en bases de datos de proporciones inmensas. Sin embargo, aunque los ejecutivos saben que esos enormes almacenes de informaci�n contienen todos los datos necesarios para tomar cierta decisi�n, en t�rminos pr�cticos es imposible tener acceso a �stos. A continuaci�n explicaremos a que nos referimos con esto.

ALMACENAMIENTO POR CONTENIDO

Y POR DIRECCI�N

Para las computadoras es sumamente f�cil buscar en listas ordenadas de datos, y �sta es por tanto una tarea que llevan a cabo en fracciones de segundo. Sin embargo, hay veces que es necesario obtener informaci�n de otro tipo. Por ejemplo, supongamos que un centro hospitalario cuenta con un archivo en el cual la informaci�n se encuentra almacenada en orden alfab�tico del apellido de los pacientes. De esta manera, cuando un m�dico requiere el expediente de un paciente, �ste es encontrado de inmediato con s�lo proporcionar su apellido. A este tipo de almacenamiento se le denomina por direcci�n, ya que al conocer el apellido del paciente sabemos exactamente la localizaci�n, o direcci�n, del expediente con respecto a los dem�s. Empero, si por ejemplo, en un momento dado surgiera la necesidad de saber los datos de todas las personas que recibieron transfusiones de sangre durante la semana 23 del a�o, debido a una sospecha de que hubo sangre contaminada con el virus del SIDA, o si se quisiera obtener la lista de todas las personas a las cuales se les aplic� alg�n tratamiento o se les administr� cierto medicamento, o si se quisiera localizar grupos de alto riesgo para alguna enfermedad con base en el sobrepeso, tipo de vivienda, antecedentes hereditarios, h�bitos alimenticios, consumo de tabaco o alcohol, etc�tera, entonces ser�a necesario analizar, uno a uno, todos los expedientes para poder encontrar a los grupos de personas de inter�s. Esto es, para localizar informaci�n con base en su contenido, la persona encargada del archivo tendr�a que hacer una b�squeda secuencial. Si la informaci�n estuviese almacenada en una computadora, esta b�squeda tomar�a un tiempo bastante largo. Pero si estuviese en gavetas el trabajo ser�a pr�cticamente irrealizable.

Al organizar un archivo o base de datos que ser� almacenado en una computadora, es posible dar varias v�as de acceso a la informaci�n. Esto se hace definiendo ciertas palabras claves que funcionar�n como etiquetas o "banderas" que indiquen el contenido del archivo, lo cual equivaldr�a al uso de tarjeteros para los archiveros. Estas palabras claves podr�an ser sexo, ocupaci�n, nivel socioecon�mico, grupo de edad, apellido, clave del Registro Federal de Causantes, o cualquiera otra. De esta manera, la computadora formula una lista ordenada, para cada una de estas palabras claves, en la cual se incluye la direcci�n para tener acceso a la informaci�n requerida. Entonces, se podr�a pedir a la computadora, por ejemplo, que hiciese un listado con base en las palabras claves que incluyera a todas las mujeres entre los 30 y los 40 a�os de edad. Sin embargo, existen complicaciones, ya que, por un lado, es imposible introducir como palabras claves toda la informaci�n que pudiera llegar a ser importante o pertinente en un momento dado, y por otro, en el momento de organizar la base de datos es necesario decidir cu�les ser�n estas palabras claves, pues la inclusi�n posterior de una palabra clave implicar�a la revisi�n, uno a uno, de todos los archivos, con el objeto de actualizar las banderas de salida de la informaci�n almacenada.

Este procedimiento de organizaci�n es igual al utilizado en los diccionarios enciclop�dicos, ya que se ha encontrado que proporciona la forma m�s f�cil de efectuar consultas. En estos libros, la informaci�n est� ordenada alfab�ticamente por temas, y se incluye un �ndice alfab�tico de las palabras claves en una secci�n especial. En dicho �ndice se incluyen los tomos y p�ginas donde aparece la informaci�n relacionada (esto es, su direcci�n). De esta manera, si quisi�ramos, por ejemplo, encontrar el nombre de los sat�lites del planeta J�piter, o el significado de alguna palabra, podr�amos encontrarlos con suma rapidez. Sin embargo, si quisi�ramos encontrar un dato como la duraci�n m�s corta de un reinado, o el nombre de la persona que escribi� cierta novela, entonces tendr�amos que contar con otra informaci�n adicional que nos permitiera escoger ciertas palabras claves. Por ejemplo, conocer los nombres de los pa�ses en que ha habido monarqu�as, o para el segundo ejemplo, conocer el idioma o �poca en que la novela fue escrita. Las otras alternativas ser�an revisar, palabra por palabra, una gran parte de la enciclopedia, o mejor a�n, preguntar a alguna persona que supiese de historia y de literatura.

Esta �ltima soluci�n es la m�s f�cil, debido a que este tipo de b�squeda de informaci�n es mucho m�s eficiente en la mente humana. Podr�amos decir que nosotros tenemos una infinidad de palabras claves que nos permiten tener acceso a la informaci�n de muchas maneras diferentes y en un tiempo muy corto. Esto es, nosotros somos capaces de almacenar informaci�n directamente por contenido y recordamos con base en asociaciones de ideas. Muchas veces un olor, una palabra, alg�n sonido, etc�tera, bastan para hacernos recordar algo. Somos capaces inclusive de recordar informaci�n al azar, sin que aparentemente haya habido ninguna idea o est�mulo que propiciara alg�n recuerdo en particular.

Otra caracter�stica importante de nuestra memoria es que �sta tolera errores, y que a su vez, es capaz de cometerlos. Tambi�n tenemos la capacidad para establecer analog�as entre cosas similares con base en diferentes criterios. Podemos reconstruir im�genes, o situaciones con base en informaci�n incompleta. Podemos leer "entre l�neas", esto es, al leer un texto podemos intuir su significado real (cuando �ste es diferente al consignado), si es que tenemos informaci�n adicional relativa a los factores que intervienen en la situaci�n. Tambi�n podemos captar un "doble sentido" en las expresiones que escuchamos; podemos "intuir" el estado de �nimo de una persona con tan solo observar sus actitudes, etc�tera. En el proceso de reconocimiento de im�genes, si �nicamente fu�semos capaces de reconocer im�genes "id�nticas" a las que tenemos memorizadas, ser�amos muy poco eficientes, siendo que, por ejemplo, nunca percibiremos a una persona de la misma manera que en otro momento anterior: variar� el peinado, la expresi�n, habr� cambios causados por el tiempo, inclusive la cantidad y color de la luz variar�n de un momento a otro produciendo un efecto diferente en la apariencia del sujeto, etc. Sin embargo, si la imagen que se nos presenta es lo suficientemente "cercana" a la informaci�n que tenemos almacenada, esto es, al recuerdo que tenemos de dicha persona, no tendremos dificultad alguna en reconocerla. Esta caracter�stica se extiende a otros tipos de identificaci�n: si dentro de un texto nos encontramos con una palabra escrita con un error ortogr�fico, somos capaces de saber el significado correcto de esta palabra �nicamente por el contexto. De igual modo, podemos reconocer de manera auditiva una misma palabra pronunciada con diferentes acentos y timbres de voz, o incluso en diferentes idiomas (suponiendo que los conozcamos). Todas las caracter�sticas anteriores son caracter�sticas naturales de la mente humana y no tienen paralelo en las computadoras convencionales.

Se han creado programas para estas computadoras cuyo objetivo es llevar a cabo tareas espec�ficas de reconocimiento de alg�n tipo. Sin embargo, estos programas son de poca eficiencia y versatilidad comparados con el desempe�o humano. Por ejemplo, las ambig�edades inherentes a cualquier lenguaje han hecho dif�cil el desarrollo de "programas" destinados a la lectura de textos "en voz alta", ya que este trabajo implica una cierta comprensi�n de las frases con el objeto de darles el �nfasis correspondiente. Una computadora, en caso de encontrarse con una palabra escrita con un error ortogr�fico, le atribuir�a a esta palabra el significado consignado en su diccionario (en caso de que existiese tal palabra), aunque la frase resultante careciese de significado.11[Nota 11]

Regresemos, al ejemplo utilizado en el cap�tulo I para definir los problemas complejos. Dicho ejemplo corresponde a una tarea muy sencilla desde nuestro punto de vista. Si le presentamos a un ni�o de tres a�os una serie de fotograf�as de personas, escogidas al azar entre la poblaci�n, y le pedimos que identifique si se trata de hombres o mujeres, nos encontraremos con que no tendr� ning�n problema de reconocer a la mayor�a de ellas. Si repetimos la prueba de un ni�o un poco mayor veremos que el porcentaje de error se reducir�, aunque la posibilidad de error siempre existir� (por peque�a que sea). Esto es debido a que, seg�n el criterio del ni�o, algunos individuos no tendr�n exclusivamente caracter�sticas t�picas de uno u otro sexo (con caracter�sticas t�picas nos referimos a rasgos ya sea de car�cter biol�gico o social). Por otro lado, la probabilidad de error depender� de la experiencia previa del ni�o, esto es, del medio en que se desenvuelve, de su nivel socioecon�mico y del tipo de informaci�n que recibe: televisi�n, revistas, escuela, amistades de los padres, etc�tera. Esto se debe a que los humanos aprendemos a trav�s de la experiencia. Es de esperarse que si al ni�o se le presentaran im�genes de personas vestidas a la usanza del siglo XVII (�o XVIII!), el porcentaje de aciertos no ser�a el mismo que el obtenido con im�genes de personas propias de su tiempo y de su medio. Ya que debemos recordar que en el hombre el desempe�o de diferentes habilidades es producto, primordialmente, del entrenamiento obtenido.

Si ahora quisi�ramos programar una computadora convencional para que llevara a cabo este mismo trabajo, indispensable darle instrucciones precisas para que efectuara dicha identificaci�n. Por ejemplo, podr�amos decirle que el pelo largo se da preferentemente en mujeres (lo cual es m�s cierto ahora que en los a�os setenta y completamente falso en otras �pocas o culturas), o que la gran mayor�a de las personas que usan aretes son mujeres, o que las mujeres tienen en general rasgos m�s suaves que los hombres. Como puede apreciarse, definir estos criterios no es tarea f�cil, ya que no siempre es verdad que el hombre sea feo, fuerte y formal, y un gran n�mero de personas no corresponde a los estereotipos. Adem�s ser�a necesario determinar qu� tan importante son unos criterios con respecto a otros. Por otro lado, habr�a que dar a la computadora las definiciones de las definiciones: �qu� es el pelo?, �c�mo distinguirlo de sombras?, �qu� son las orejas, los aretes, la nariz, la manzana de Ad�n?, �qu� significa tener rasgos finos, boca grande, pesta�as largas, mirada dulce?, �con respecto a qu�? Por otro lado, para complicar m�s la situaci�n, todas estas definiciones no podr�an darse en palabras, ya que �stas no tienen ning�n significado para la computadora, sino que habr�an de darse en un lenguaje apropiado para la m�quina.12[Nota 13] Dados los mecanismos de funcionamiento de las computadoras actuales, es f�cil darse cuenta de por qu� un ni�o peque�o ser� capaz de llevar a cabo este trabajo con mucho m�s �xito que una gran computadora que trabaja con programas muy elaborados.

Es com�n escuchar que las computadoras tienen una capacidad para almacenar y procesar informaci�n muy superior a la del hombre. Nosotros creemos que esta informaci�n carece de sentido, ya que no es correcto comparar habilidades diferentes. Por un lado, la capacidad de almacenamiento de las computadoras es pr�cticamente ilimitada, ya que siempre es posible aumentarla mediante el uso de discos o cintas magn�ticas; aunque la rapidez para localizar esta informaci�n se ve seriamente mermada cuando se trata de obtener informaci�n por contenido. Por otro lado, la cantidad de informaci�n que puede almacenar un hombre en su memoria es inmensa, e imposible de cuantificar, aunque �ste no siempre sea capaz de recordarla. Algunas personas podr�an calificar la mayor parte de la informaci�n que almacenamos como in�til en t�rminos pr�cticos; sin embargo �sta constituye gran parte de lo que son nuestro car�cter, personalidad, sentido com�n, tacto, intuici�n, capacidad para manejar situaciones, percepci�n de signos de peligro y de situaciones anormales, etc�tera. Esto dejando de lado todo el conocimiento necesario para efectuar con destreza el movimiento de las diversas partes de nuestro cuerpo, indispensable para conservar el equilibrio, caminar, comer, escribir, correr, rascarnos, sentarnos, etc�tera. Tareas todas que debemos aprender a efectuar.

Casi todos hemos visto en el cine una u otra historia basada en la famosa novela acerca de Frankestein escrita por Mary W. Shelley. Dicha novela trata de la historia del doctor Frankestein, quien construye un ser a partir de restos de cad�veres humanos y es capaz de darle vida. M�s adelante, esta criatura empieza a aprender los conocimientos necesarios para desempe�arse como un ser humano. Si nos ponemos a pensar tan solo un momento en la cantidad de informaci�n que necesitar�a aprender para logran este objetivo, podremos darnos cuenta de lo ambicioso de este proyecto, pues ser�a necesaria toda una vida para lograrlo. No es casual que los ni�os sean ingenuos, poco maliciosos, espont�neos y que manifiesten sus estados de �nimo en forma m�s directa, esto es, que carezcan de cierta "sofisticaci�n" presente en los adultos, adem�s de poseer menos datos, o informaci�n cuantificable en su memoria (como lo que com�nmente se denomina "cultura general").

Para finalizar, quisi�ramos mencionar otra caracter�stica que diferencia a las memorias de las computadoras de las de los seres humanos. A una computadora se le puede programar para que haga una lista en la que incluya "toda" la informaci�n que tiene almacenada. Esta tarea es realizable, en principio, independientemente de la cantidad de informaci�n almacenada. Por el contrario, los seres humanos somos incapaces de hacer una relaci�n de "todos" nuestros conocimientos;13 [Nota 13]y esta limitaci�n no es s�lo de car�cter pr�ctico, sino de �ndole fundamental. Esto se debe a que el procedimiento mediante el cual almacenamos y recordamos la informaci�n no es compatible con esta tarea. Esperamos que esto sea claro para el lector al finalizar la lectura de este libro.

Esperamos tambi�n que a estas alturas se haya logrado despertar en el lector un inter�s por encontrar la respuesta a preguntas como: �de qu� manera consigue la mente humana recordar informaci�n en el momento en que la necesita?, �cu�les son los mecanismos de almacenamiento y remembranza?, �en d�nde es que se almacena dicha informaci�n?, �c�mo se procesa �sta? Aunque a�n no podemos dar una respuesta a la mayor�a de estas preguntas, creemos tener una idea clara acerca de cu�les son los principios fundamentales que intervienen en el proceso de almacenamiento de informaci�n. Los avances en este terreno, adem�s de ser de un gran inter�s desde el punto de vista de nuestra necesidad de conocernos a nosotros mismos, tienen un gran potencial tecnol�gico, pues de conocerse las respuestas a estas preguntas, salvo limitaciones de car�cter tecnol�gico, podr�an utilizarse estos mismos mecanismos en la construcci�n de computadoras.

InicioAnteriorPrevioSiguiente