Skip to main content

Adaptador de Archivos PDF

English

Introducción

El Adaptador PDF permite interactuar con un fichero .pdf, de forma que pueda verificar si se ha generado correctamente y contiene la información que se supone que debe contener. También podrá realizar muchas comprobaciones con dicho fichero .pdf gracias a las funciones predefinidas que enumeraremos a continuación. Será útil para probar todos aquellos procesos en los que esté implícita la generación de un fichero .pdf. 

Parámetros de Inicialización

En el proceso de inicialización de este Adaptador es necesario proporcionar la información siguiente: 

  • FilePath: ruta completa del archivo .pdf.

Funciones Predefinidas (PF's)

  • checkTextOnDocument(Page Area, Search Text): busca un texto dado en un área específica del documento (Página completa, Encabezado, Cuerpo, Pie de página). Esta función busca una coincidencia exacta del texto de búsqueda.
  • checkTextOnPage: devuelve true, si encuentra el texto especificado por el parámetro Search Text, en el área indicada por el parámetro PageArea, en la página representada por el parámetro Page, el número de veces introducido en Occurrences. False en caso contrario.
  • checkTextOnPageArea(Page, CoordinateX, CoordinateY, Width, Height, Text): esta función devuelve verdadero si el parámetro Texto existe dentro del área de la pagina definida por los parámetros. El parámetro Page indica el número de la página a transformar. CoordinateX y CoordinateY indican las coordenadas de inicio del área. Width y Height indican el tamaño del área deseada, text es el texto que debe comprobar esta función. Y por último la imagen contará con 72 ppp de resolución.
  • generateFileAsEvidence: la función genera una copia del fichero PDF en su estado actual para añadirlo como evidencia.
  • getCustomMetaData: devuelve el valor del metadato personalizado especificado en su parámetro de entrada. Los metadatos personalizados son otros distintos a los automáticos que se incluyen manualmente en los documentos. En el nombre del metadato se discrimina entre mayúsculas y minúsculas.
  • getDataSigned: otiene los datos de la firma del documento en el caso de que esté firmado digitalmente. Devuelve en salida una variable TastTableData. Los datos se devuelven en una fila y N columnas.
  • getMetaData: devuelve el valor del metadato seleccionado en el desplegable del parámetro de entrada. Son los metadatos automáticos como: title, author, subject, keyWords, creator, producer, pageCount, creationDate, modificationDate, traped.
  • getNumPages(): devuelve el número de páginas del documento.
  • getNumRows: devuelve el número de filas del documento.
  • getNumWhitePages(): devuelve el número de páginas blancas del documento.
  • getPageAsImage(Page, File): esta función transforma una pagina de pdf en una imagen .jpg con una resolución de 72 ppp. Los parámetros de entrada con los que contamos son Page, que indica el número de página a transformar y el parámetro File que indica la ruta y el nombre de archivo donde la imagen se generará. La extensión es .jpg.
    El propósito de esta imagen es permitir al usuario cargarla en cualquier aplicación que le ayude a identificar las coordenadas donde aparezca una parte de texto.
    Además, si la opción de Obtener evidencias está marcada, esta función generará el fichero de imagen en la carpeta del log, como evidencia del paso.
  • getPageText: permite recuperar el texto contenido en una página de un PDF, y la función genera como evidencia un fichero con el texto recuperado.
  • getTextCountOnDocument(Search Text): cuenta el número de veces que el texto de búsqueda está presente en el documento.
  • getTextCountOnPage(Page, Search Text, Page Area): cuenta el número de veces que el texto de búsqueda está presente en un área específica (Página, Encabezado, Cuerpo, Pie de página) de una página dada. La función busca coincidencias exactas del texto de búsqueda dado.
  • getTextPageByArea(Page, CoordinateX, CoordinateY, Width, Height): esta función extrae y devuelve el texto que esta contenido dentro de un área de la página. El parámetro page indica el número de la página a transformar. CoordinateX y CoordinateY indican las coordenadas de inicio del área. Width y Height indican el tamaño del área deseada y por último la imagen contará con 72 ppp de resolución.
  • isPageWhite(Page): devuelve “true” si la página especificada es blanca, “false” si no.
  • isSigned: devuelve en su variable de salida booleana, “true” o  “false”, según el documento está firmado digitalmente o no.
  • readPdfFile: lee un fichero PDF y lo carga para su procesamiento.