backend/core/utils.py

from api.organization.models import UsoAlmacenamiento
from dataclasses import dataclass
import xml.etree.ElementTree as ET
from typing import List, Dict


def verificar_espacio_disponible(organizacion, tamaño_archivo):
    try:
        uso = UsoAlmacenamiento.objects.get(organizacion=organizacion)
        if uso.espacio_disponible < tamaño_archivo:
            raise ValueError("La organización no tiene suficiente espacio de almacenamiento disponible")
        return True
    except UsoAlmacenamiento.DoesNotExist:
        # Si no existe registro, crear uno
        UsoAlmacenamiento.objects.create(organizacion=organizacion, espacio_utilizado=0)
        return True


@dataclass
class PedimentoScrapper: # Clase me extrae datos de Pedimento
    """
    Clase para manejar la extracción de datos de un XML.
    """

    def _get_numero_operacion(self, root: ET.Element) -> str:
        """
        Método para obtener el número de operación del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Número de operación como string.
        """
        numero_operacion = root.find('.//ns2:numeroOperacion', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        return numero_operacion.text if numero_operacion is not None else None

    def _get_pedimento(self, root: ET.Element) -> str:
        """
        Método para obtener el pedimento del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Pedimento como string.
        """
        pedimento = root.find('.//ns2:pedimento/ns2:pedimento', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        return pedimento.text if pedimento is not None else None

    def _get_curp_apoderado(self, root: ET.Element) -> str:
        """
        Método para obtener el CURP del apoderado del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            CURP del apoderado como string.
        """
        curp_apoderado = root.find('.//ns2:curpApoderadomandatario', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        return curp_apoderado.text if curp_apoderado is not None else None

    def _get_agente_aduanal(self, root: ET.Element) -> str:
        """
        Método para obtener el RFC del agente aduanal del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            RFC del agente aduanal como string.
        """
        agente_aduanal = root.find('.//ns2:rfcAgenteAduanalSocFactura', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        return agente_aduanal.text if agente_aduanal is not None else None

    def _get_partidas(self, root: ET.Element) -> int:
        """
        Método para obtener el número máximo de partidas del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Número máximo de partidas como entero.
        """
        partidas_elements = root.findall('.//ns2:partidas', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        partidas_values = []
        for elem in partidas_elements:
            try:
                if elem.text is not None:
                    partidas_values.append(int(elem.text))
            except ValueError:
                continue

        return max(partidas_values) if partidas_values else None

    def _get_identificadores_ed(self, root: ET.Element) -> list:
        """
        Método para obtener todos los identificadores con clave 'ED' del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Lista de diccionarios con los datos de identificadores ED.
        """
        namespaces = {
            'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto',
            'ns': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/comunes'
        }
        identificadores_ed = []

        # Buscar todos los elementos identificadores
        identificadores_elements = root.findall('.//ns2:identificadores/ns2:identificadores', namespaces)

        for identificador in identificadores_elements:
            try:
                # Extraer la clave del identificador (está dentro de claveIdentificador con namespace)
                clave_elem = identificador.find('ns:claveIdentificador/ns:clave', namespaces)
                clave = clave_elem.text if clave_elem is not None else None

                # Solo procesar si la clave es 'ED'
                if clave == 'ED':
                    # Extraer descripción (con namespace)
                    descripcion_elem = identificador.find('ns:claveIdentificador/ns:descripcion', namespaces)
                    descripcion = descripcion_elem.text if descripcion_elem is not None else None

                    # Extraer complemento1 (con namespace)
                    complemento1_elem = identificador.find('ns:complemento1', namespaces)
                    complemento1 = complemento1_elem.text if complemento1_elem is not None else None

                    # Agregar a la lista si tenemos los datos básicos
                    if clave and complemento1:
                        identificadores_ed.append({
                            'clave': clave,
                            'descripcion': descripcion,
                            'complemento1': complemento1
                        })

            except Exception as e:
                # Log del error pero continuar procesando otros identificadores
                print(f"Error procesando identificador: {e}")
                continue

        return identificadores_ed

    def _remesas(self, root: ET.Element) -> bool:
        """
        Método para verificar si el pedimento tiene remesas.
        Busca identificadores con clave 'RC' (REMESAS DE CONSOLIDADO).

        Args:
            root: Elemento raíz del XML.

        Returns:
            True si encuentra identificadores con clave 'RC', False en caso contrario.
        """
        namespaces = {
            'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto',
            'ns': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/comunes'
        }

        # Buscar todos los elementos identificadores
        identificadores_elements = root.findall('.//ns2:identificadores/ns2:identificadores', namespaces)

        for identificador in identificadores_elements:
            try:
                # Extraer la clave del identificador
                clave_elem = identificador.find('ns:claveIdentificador/ns:clave', namespaces)
                clave = clave_elem.text if clave_elem is not None else None

                # Si encontramos una clave 'RC', el pedimento tiene remesas
                if clave == 'RC':
                    return True

            except Exception as e:
                # Log del error pero continuar procesando otros identificadores
                continue
        return False

    def _get_tipo_operacion(self, root: ET.Element) -> str:
        """
        Método para obtener el tipo de operación del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Tipo de operación como string.
        """
        tipo_operacion = root.find('.//ns2:tipoOperacion/ns2:clave', namespaces={'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'})
        return tipo_operacion.text if tipo_operacion is not None else None

    def _get_cove(self, root: ET.Element) -> str:
        """
        Método para obtener el número de COVE del XML.

        Args:
            root: Elemento raíz del XML.

        Returns:
            Número de COVE como string.
        """
        namespaces = {
            'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto',
            'ns': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/comunes'
        }
        facturas = root.findall('.//ns2:facturas', namespaces=namespaces)
        coves = []
        for factura in facturas:
            cove = factura.find('ns2:numero', namespaces)
            if cove is not None:
                coves.append(cove.text)
            else:
                print("No se encontró <ns2:numero> en la factura.")

        return coves if coves else None


    def _get_fecha_pago(self, root: ET.Element) -> str:
        ns = {'ns2': 'http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarpedimentocompleto'}
        for fechas in root.findall('.//ns2:fechas', ns):
            clave = fechas.find('./ns2:tipo/ns2:clave', ns)
            if clave is not None and clave.text == '2':
                fecha = fechas.find('./ns2:fecha', ns)
                if fecha is not None and fecha.text:
                    # Extraer solo la parte de la fecha (YYYY-MM-DD)
                    fecha_str = fecha.text
                    # Si el formato es 'YYYY-MM-DD-06:00', tomar los primeros 10 caracteres
                    return fecha_str[:10]
        return None

    def extract_data(self, xml_content: str) -> dict:
        """
        Método para extraer datos específicos del XML.

        Args:
            xml_content: Contenido del XML como string.

        Returns:
            Diccionario con los datos extraídos.
        """
        try:
            root = ET.fromstring(xml_content)

            # Extraer datos con manejo de errores individual
            data = {}

            data['numero_operacion'] = self._get_numero_operacion(root)
            data['pedimento'] = self._get_pedimento(root)
            data['curp_apoderado'] = self._get_curp_apoderado(root)
            data['agente_aduanal'] = self._get_agente_aduanal(root)
            data['numero_partidas'] = self._get_partidas(root)
            data['identificadores_ed'] = self._get_identificadores_ed(root)
            data['remesas'] = self._remesas(root)
            data['tipo_operacion'] = self._get_tipo_operacion(root)
            data['coves'] = self._get_cove(root)
            data['fecha_pago'] = self._get_fecha_pago(root)

            # Verificar que se extrajeron los datos esenciales
            if not any([data['numero_operacion'], data['pedimento'], data['curp_apoderado'], data['agente_aduanal'], data['coves']]):
                return {}

            return data

        except ET.ParseError as e:
            print(f"Error al parsear el XML: {e}")
            return {}
        except Exception as e:
            print(f"Error inesperado al extraer datos del XML: {e}")
            return {}

        return extract_xml_data(xml_content)

class XMLControllerRemesas:
    """
    Controlador para scrapear XML de consultar remesas.
    Extrae todos los comprobantesVE, junto con remesaAgente y remesaSA.
    """

    namespaces = {
        "S": "http://schemas.xmlsoap.org/soap/envelope/",
        "ns2": "http://www.ventanillaunica.gob.mx/common/ws/oxml/respuesta",
        "ns3": "http://www.ventanillaunica.gob.mx/pedimentos/ws/oxml/consultarremesas",
    }

    def extract_remesas(self, xml_content: str) -> List[Dict[str, str]]:
        """
        Extrae todos los comprobanteVE de un XML de remesas.

        Args:
            xml_content: Contenido del XML en string.

        Returns:
            Lista de diccionarios con comprobanteVE, remesaAgente y remesaSA.
        """
        try:
            root = ET.fromstring(xml_content)

            remesas = []
            for remesa in root.findall(".//ns3:remesas", self.namespaces):
                comprobante = remesa.find("ns3:comprobanteVE", self.namespaces)
                agente = remesa.find("ns3:remesaAgente", self.namespaces)
                sa = remesa.find("ns3:remesaSA", self.namespaces)

                remesas.append({
                    "comprobanteVE": comprobante.text if comprobante is not None else None,
                    "remesaAgente": agente.text if agente is not None else None,
                    "remesaSA": sa.text if sa is not None else None
                })

            return remesas

        except ET.ParseError as e:
            print(f"Error al parsear XML: {e}")
            return []
        except Exception as e:
            print(f"Error inesperado: {e}")
            return []

xml_controller = PedimentoScrapper()
xml_remesas_controller = XMLControllerRemesas()