Data/Backend · Python + SQL · ETL Ingeniero electrónico

Automatizo procesos con Python + SQL: ETL confiable, trazabilidad y reportes.

Diseño y opero pipelines para ingesta de imágenes, PDFs, archivos Excel, CSV y captura OMR/ICR/OCR (códigos de barras y Datamatrix), con validación y conciliación operativa. Experiencia en altos volúmenes de data (sector público) con trazabilidad end-to-end, orquestación y MLOps básico.

Highlights

  • Reduje ~40% el tiempo de procesamiento masivo estandarizando ETL y agregando observabilidad (logs, checksums, métricas, reintentos).
  • ETL Python → SQL Server con validaciones, control de totales y deduplicación idempotente.
  • Orquestación con Prefect/Airflow (jobs batch, alertas) y despliegue en Windows Server/Linux.

Proyectos destacados

Ver todos →
Python Pandas SQLAlchemy SQL Server SQLite

ETL de conciliación operativa (demo sintética)

Ingesta de CSV → validación con Pandera → deduplicación (hash/idempotente) → UPSERT a SQL Server/SQLite → reporte Excel y observabilidad (logs JSON + métricas). 10.5K registros en ~3.1s, 88.78% tasa de validación.

  • Reglas explicables, checksums y trazabilidad de punta a punta
  • Listo para re-ejecución sin duplicados (UPSERT MERGE)
Python Pandas SQL Server/Postgres Great Expectations/Pandera

Lakehouse de tarjetas de crédito (PySpark, demo sintética)

Generación de transacciones sintéticas de tarjeta, capas Bronze→Silver→Gold en Parquet/Delta, particionadas por fecha. Features por cliente/mes y consultas de ejemplo.

  • PySpark + Delta/Parquet, particionado y joins
FastAPI MLflow TensorFlow PyTorch Docker CI/CD (GitHub Actions)

MLOps mini-stack: entrenamiento, tracking y despliegue

Entrenamiento (scikit-learn / TensorFlow / PyTorch), tracking con MLflow, empaquetado como API FastAPI y despliegue Docker. Pipeline CI que ejecuta tests, lint y build de imagen.

  • Plantilla lista para clonar y adaptar a cualquier modelo
PySpark Delta/Parquet Airflow/Prefect

Explorador de skills laborales (ETL + análisis)

Lee un CSV de ofertas/skills y grafica las habilidades más demandadas; útil para comparar roles, seniority y periodos.

Tecnologías

Data/Backend

Python, FastAPI, Pandas, OpenCV, PySpark

Bases de datos

SQL Server, Postgres, Oracle (básico), SQLite

ETL/Orquestación

Prefect, Airflow, Control-M (exposición), cron

MLOps

MLflow, FastAPI, Docker, GitHub Actions, DVC (básico)

Modelado / Deep Learning

scikit-learn, TensorFlow, PyTorch

Observabilidad

logging estructurado, checksums, métricas, alertas

Frontend ops

PySide6 (tooling de operaciones)

¿Conversamos?

Envíame un mensaje.