Modelo de Digitalización
Proceso de Digitalización
Necesidades Típicas
El proceso de digitalización de documentos debe transformar en digital un documento soportado en tecnología papel, garantizando que el documento transformado (documento digital) es una representación digital exacta del documento original (documento papel). De esta manera se garantiza la autenticidad del documento digital.
El proceso de creación del documento digital debe garantizar la inalterabilidad de su contenido, por ejemplo mediante firma digital y la seguridad en su acceso, administrando un esquema de permisos que sólo dejen acceder a la información digital a aquellas personas que hayan sido autorizadas.
Proceso de Digitalización
El proceso de digitalización se inicia con el arribo de la documentación a ser digitalizada y finaliza cuando la misma se encuentra disponible para su reintegro al área emisora y los documentos digitales ya se encuentran almacenados y listos para su utilización por parte de los usuarios autorizados a ese efecto.
Al recibirse documentación para ser digitalizada los documentos son acomodados en cajas las que los transportarán hasta el fin del proceso.
Paso primero – Preparación y Rotulación del Lote
Los documentos arriban al sector de digitalización en cajas. Dentro de la caja puede haber documentos en diferentes formatos tales como mapas cartográficos, A4, carta, diarios, fotos, u otros.
Un operador toma el material y lo vacía en un canasto denominado canasto de procesamiento, que ya lleva codificación para identificar el lote.
Paso segundo – Clasificación del Material
A.- El operador saca los documentos del canasto y los ubica sobre la mesa de clasificación donde procede clasificar los documentos, separando los documentos en aquellos que se van a escanear y aquellos que no. Luego clasifica por tamaño de papel según sean menores o mayores al formato A3. (El formato A3 es un estándar para el máximo tamaño de escaneo de los escáneres automáticos).
B.- Aquellos documentos cuyo tamaño es menor al formato A3 son pre clasificados según se puedan escanear en forma automática o deban ser escaneados en forma manual.
C.- Los documentos cuyo tamaño es superior al formato A3 serán escaneados en forma manual mediante el escáner de rodillos.
D.- Los excedentes se devuelven físicamente al canasto de procesamiento. El operador pudo haber descartado material por varias razones por ejemplo que no se trate de papel (un cuadro). Lo descartado no será procesado.
Paso tercero – Catalogación
Ese u otro operador realiza la catalogación de los documentos a ser escaneados asignándoles el código nomenclador. Esta tarea puede hacerla pegándoles etiquetas o más comúnmente con un lápiz de trazo
Esa discriminación identifica los documentos del lote, asociando todos los componentes de un documento a un código nomenclador.
Una vez identificados todos los documentos del lote, desune aquellas hojas que se encuentren unidas por algún medio, grapas o cosidas.
En esta instancia los documentos están clasificados, catalogados y susceptibles de ser procesados. Según sea el tipo de documento irá a ser procesado en una línea de escaneo: manual, automático o de rodillo.
Paso cuarto – Captura o Escaneo
El software de escaneo captura una imagen del papel que está siendo procesado, y la almacena en forma temporaria en el formato gráfico estándar elegido (los más comunes son TIFF, PDF, PDF/A, PDF examinable); realiza el reconocimiento óptico de caracteres (OCR) y lo almacena por código nomenclador asociándolo de esta manera a todos los otros componentes del documento.
Puede agregar datos específicos como número de catálogo, fecha y hora de escaneo, operador y otra que puede configurarse. Esta información junto con otra que puede ser adjuntada a la estructura de archivo que contiene la digitalización del documento se la conoce con el nombre de Metadata.
El documento digitalizado queda así en una estructura de almacenamiento temporaria que contiene la siguiente información, por ejemplo:
Resumiendo, en el proceso de escaneo no sólo se captura la imagen sino que además se asocia a través del código nomenclador todos los componentes que pertenecen al mismo documento completo. Por ejemplo, si se tiene un documento conteniendo notas, mapas, recortes de diario y otros formatos diferentes que requieren que las partes del documento sean procesadas en líneas diferentes de digitalización, el software de escaneo cumple la función adicional de asegurar que el resultado es un solo documento digital, réplica del documento papel, y con todas sus partes independientemente del la línea que lo escaneó. Es decir, que la coherencia e integridad de los documentos es independiente del proceso de escaneo.
Otro valor agregado del software de escaneo es que se puede hacer un tratamiento previo de los datos. Es decir, que si se conoce el tipo de formato, por ejemplo expediente, se puede establecer en el software de escaneo una precarga automática de metadata de acuerdo al documento. Cuanto más se conozca el formato del documento mejor se tipificará y procesará automáticamente la Metadata.
Paso quinto – Re ensamblado y Control del Proceso
Aún falta certificar que el documento digital recientemente creado, es una representación digital exacta del documento original (documento papel).
A la salida de la línea de escaneo hay un compaginador cuya función es volver a reunir con su ordenamiento original , la totalidad de los componentes de un documento físico.
Luego del compaginador, hay un supervisor que toma la fuente de datos digital y la compara con los documentos físicos que le entregó el compaginador. Para este caso no importa la experiencia del supervisor, pues solo tiene que corroborar que lo físico es igual a lo escaneado.
Acá puede ocurrir una de tres situaciones:
Que reenvíe el documento para ser escaneado nuevamente (caso en que tintas azul pálido son usadas y el escáner no las identifica correctamente).
Que rechace el escaneo por defectuoso (caso excepcional en que el producto resultante no es de calidad, luego de haber iterado el proceso el propio supervisor)
Que apruebe el trabajo, es decir, certifique que los datos del documento digital son la representación exacta del documento original en soporte papel.
Particularmente en la etapa de la aprobación, el supervisor puede decidir reprocesar el documento manualmente para garantizar que el escaneo obtenido es el producto del documento fuente. Por ejemplo esto puede pasar para casos en que el contenido es sensible o que el documento es borroso. Lo tiene que hacer el propio supervisor para corroborar y certificar que es realmente el producto de lo escaneado. El trabajo debe realizarse manualmente por el supervisor para no corromper el procedimiento de aprobación.
Una vez certificado el trabajo, el documento original se compagina.
Una vez aprobado el documento digitalizado, el operador sella el archivo conteniendo los datos digitalizados con la aplicación de firma digital u otro mecanismo de encriptación, que servirá para evitar que la información digitalizada sea alterada.
Los documentos ya compaginados y aprobados vuelven al canasto. Los desaprobados, si hay que reprocesar vuelven al Paso cuarto - Escaneo. Los rechazados vuelven al canasto, con el rótulo de rechazo y motivo.
Registro
A partir del momento en que el documento es catalogado comienza a tener trazabilidad. Por ejemplo se puede saber quien lo leyó, quien lo procesó, quien lo retiró del canasto.
Este registro se genera como resultado de las tareas realizadas por los operadores en cada uno de sus puestos, al realizar las lecturas del lote ó catálogo con un lector de código de barra marcando en la base de datos de procesamiento, el código de catálogo, proceso, fecha y hora.
Como resultado de lo realizado queda en la base de datos el log o registro de cada documento. Esto es fundamental para la trazabilidad del proceso de escaneo.
Finalmente se tiene en la base de datos, los documentos digitalizados y aquella Metadata que fue extraída del los documentos originales.
Paso sexto – Carga de Metadata adicional
Aquí comienza la segunda parte del proceso donde solo se trabaja con los documentos digitales.
En esta etapa, el operador accede al documento original y realiza un pos procesamiento de metadata según un esquema especificado. Por ejemplo puede incluir los datos mencionados en el “Paso cuarto – Escaneo, Otra Metadata”. Un supervisor aprueba la carga de la metadata.
Existen herrmientas de software que permiten trabajar con cargas masivas, y realizar la extraccióm de datos en forma automatizada, dependiendo de una configuración a modo de template previamente configurado, esto permite hacer en minutos operaciones que llevarían horas o incluso días de personal operativo dedicado a esa única tarea.
Al final de esta segunda etapa ya se tiene el documento certificado, aprobado y con su metadata cargada.
En este punto se ha finalizado el proceso de digitalización, se tiene la base de documentos final con los datos y disponible para ingresar en un software de explotación de documentos y con funcionalidad de clasificación, y búsqueda.
Para el caso de expedientes y otros documentos que crecen en la cantidad de hojas que lo componen, como la Metadata se mantiene, sólo irá variando la versión del documento. Es decir, si se busca un expediente, el resultado puede mostrar cincuenta instancias del mismo pudiendo verse el historial de su evolución. De todas formas el software de explotación de documentos es configurable y permite decidir cómo se quiere ver los resultados.