El paquete APEX_DATA_PARSER facilita la visualización de datos con formato CSV, JSON, XML y XLSX como filas y columnas de SQL. La función más importante de este paquete es la función PARSE, que se implementa como una función de tabla que devuelve filas del tipo APEX_T_PARSER_ROW. Hay una columna LINE_NUMBER, luego columnas denominadas COL001, COL300 por lo que hay un máximo de 300 columnas en los datos.

Los valores generalmente se devuelven en formato VARCHAR2. Una fila de tabla devuelta puede tener un máximo de 300 columnas. La longitud máxima de una columna de la tabla VARCHAR2 es 4000 bytes; no hay un máximo de longitud de línea. 20 de las 300 columnas admitidas se pueden manejar como CLOB.

El análisis de archivos se realiza sobre la marcha cuando se invoca esta función. Los datos no se escriben en una colección ni en una tabla temporal.

Debemos tener instalado APEX 19.1 o posterior en la base de datos para que este paquete esté disponible, pero podemos utilizar el paquete independientemente de APEX.

A partir de APEX versión 19.2, este paquete admite valores de cadena superiores a 4000 bytes. 20 de las 300 columnas admitidas se pueden manejar como archivo CLOB. El nivel de soporte  CLOB depende del tipo de archivo que se esté analizando.

Para esta demostración vamos a crear un archivo CSV con los siguientes datos: Employees.csv

EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO
7839 KING PRESIDENT 11/17/1981 5000 10
7698 BLAKE MANAGER 7839 5/1/1981 2850 30
7782 CLARK MANAGER 7839 6/9/1981 2450 10
7566 JONES MANAGER 7839 4/2/1981 2975 20
7788 SCOTT ANALYST 7566 12/9/1982 3000 20
7902 FORD ANALYST 7566 12/3/1981 3000 20
7369 SMITH CLERK 7902 12/17/1980 800 20
7499 ALLEN SALESMAN 7698 2/20/1981 1600 300 30
7521 WARD SALESMAN 7698 2/22/1981 1250 500 30
7654 MARTIN SALESMAN 7698 9/28/1981 1250 1400 30
7844 TURNER SALESMAN 7698 9/8/1981 1500 0 30
7876 ADAMS CLERK 7788 1/12/1983 1100 20
7900 JAMES CLERK 7698 12/3/1981 950 30
7934 MILLER CLERK 7782 1/23/1982 1300 10

Ahora que tenemos el archivo CSV podemos comenzar con nuestro ejemplo.

Creamos una página en blanco en nuestra aplicación en Oracle APEX.

  1. Creamos una región de contenido estático.
  2. Dentro de la región creamos un elemento de página de tipo Carga de Archivo en mi caso será P4_ARCHIVO.
    1. En almacenamiento seleccionar: Table APEX_APPLICATION_TEMP_FILES.
  3. Creamos un botón que lo denominaremos Cargar Datos, para ejecutar la página.

4. Creamos una region de tipo Informe Clásico.

Con la siguiente consulta SQL de origen:

select line_number, col001, col002, col003, col004, col005,col006, 
col007, col008, col009, col010
-- more columns (col011 to col300) can be selected here.
  from apex_application_temp_files f, 
    table( apex_data_parser.parse(
          p_content => f.blob_content,
          p_add_headers_row => 'Y',
          p_max_rows => 50,
          p_store_profile_to_collection => 'FILE_PARSER_COLLECTION',
          p_file_name => f.filename ) ) p
    where f.name = :P4_ARCHIVO

Elementos de página a Ejecutar: :P4_ARCHIVO

                      En Condiciones del Servidor que el elemento :P4_ARCHIVO no sea nulo.

5. Creamos otra región de Informe Clásico

Con la siguiente consulta SQL de origen:

select column_position, column_name, data_type, format_mask
  from apex_collections c, 
      table( apex_data_parser.get_columns( p_profile => c.clob001 ) )
  where c.collection_name = 'FILE_PARSER_COLLECTION' 
  and c.seq_id = 1

En Condiciones del Servidor que el elemento :P4_ARCHIVO no sea nulo.

Al ejecutar la pagina se mostrará los datos del archivo CSV en el primer informe clásico:

Y además abajo se mostrará en el segundo informe clásico las columnas que descubre del archivo CSV :

Para conocer más sobre este paquete accede a la documentación AQUI.

Hasta la próxima!