Data/Backend · Python + SQL · ETL Ingeniero electrónico

I build trusted pipelines with Python→SQL Server, trazabilidad y reportes.

Automatizo ingestas, validaciones y conciliaciones operativas/contables. Experiencia en proyectos de alto volumen (sector público) y herramientas de orquestación y MLOps básico.

Highlights

  • Reduje ~40% el tiempo de procesamiento masivo estandarizando ETL y agregando observabilidad (logs, checksums, métricas, reintentos).
  • ETL Python → SQL Server con validaciones, control de totales y deduplicación idempotente.
  • Orquestación con Prefect/Airflow (jobs batch, alertas, CRON) y despliegue en Windows Server/Linux.

Proyectos destacados

Ver todos →
Python OpenCV Tesseract/Doctr SQL Server Prefect

ETL de conciliación operativa (demo sintética)

Ingesta de archivos operativos/contables (CSV) → validaciones de esquema y control de totales → deduplicación → carga a SQL (SQL Server/Postgres) → reporte automático y observabilidad (logs estructurados, métricas, reintentos). 100% datos sintéticos.

  • Reduce tiempos de conciliación con reglas explicables y trazabilidad
  • Orquestación con Prefect/Airflow y documentación clara
Python Pandas SQL Server/Postgres Great Expectations/Pandera

Lakehouse de tarjetas de crédito (PySpark, demo sintética)

Generación de transacciones sintéticas de tarjeta, capas Bronze→Silver→Gold en Parquet/Delta, particionadas por fecha. Features por cliente/mes y consultas de ejemplo.

  • PySpark + Delta/Parquet, particionado y joins
FastAPI MLflow TensorFlow PyTorch Docker CI/CD (GitHub Actions)

MLOps mini-stack: entrenamiento, tracking y despliegue

Entrenamiento (scikit-learn / TensorFlow / PyTorch), tracking con MLflow, empaquetado como API FastAPI y despliegue Docker. Pipeline CI que ejecuta tests, lint y build de imagen.

  • Plantilla lista para clonar y adaptar a cualquier modelo
PySpark Delta/Parquet Airflow/Prefect

Explorador de skills laborales (ETL + análisis)

Lee un CSV de ofertas/skills y grafica las habilidades más demandadas; útil para comparar roles, seniority y periodos.

Tecnologías

Data/Backend

Python, FastAPI, Pandas, OpenCV, PySpark

Bases de datos

SQL Server, Postgres, Oracle (básico), SQLite

ETL/Orquestación

Prefect, Airflow, Control-M (exposición), cron

MLOps

MLflow, FastAPI, Docker, GitHub Actions, DVC (básico)

Modelado / Deep Learning

scikit-learn, TensorFlow, PyTorch

Observabilidad

logging estructurado, checksums, métricas, alertas

Frontend ops

PySide6 (tooling de operaciones)

¿Conversamos?

Envíame un mensaje.