Filtrar CSV
Aplica filtros por columna y condición. Exporta solo las filas que necesitas.
100% local, tu archivo no sale de tu navegador
Todo el procesamiento ocurre en tu dispositivo. No subimos nada a ningún servidor.
Arrastra un CSV para filtrar
Filtrar CSVs: reducir datos a lo esencial
Un CSV puede tener cientos de miles de filas, pero usualmente solo te interesan algunas: las ventas de marzo, los clientes con RUT específico, los productos bajo stock, las transacciones mayores a un monto. Filtrar es la operación fundamental para aislar el subset relevante.
En Excel, filtrar es un clic en el encabezado. En programación, es un WHERE en SQL o un .filter() en pandas. Esta herramienta trae esa ergonomía al navegador para archivos que no quieres subir a un servidor ni abrir con Excel por razones de velocidad.
Operadores disponibles
Texto:
- es igual a / no es igual a: comparación exacta (case-sensitive).
- contiene / no contiene: substring case-insensitive. Más permisivo.
- empieza con / termina con: prefijo o sufijo. Útil para filtrar códigos, fechas ISO, dominios de email.
- está vacío / no está vacío: celdas nulas o string vacío. Útil para limpiar datasets con valores faltantes.
Numérico:
- mayor que / menor que: comparación numérica. Interpretamos coma decimal (1.500,50) y punto decimal (1500.50) como equivalentes.
- entre (A y B): rango inclusivo. La fila matchea si la celda está en [min(A,B), max(A,B)].
Combinando filtros: AND vs OR
Cuando hay dos o más filtros, conviene decidir cómo se combinan:
- AND (todos): una fila matchea solo si cumple TODOS los filtros. Ej: “ciudad = Santiago” AND “monto > 100000” → ventas en Santiago que además superen los 100k.
- OR (al menos uno): una fila matchea si cumple al menos uno de los filtros. Ej: “ciudad = Santiago” OR “ciudad = Viña” → ventas en cualquiera de las dos.
La diferencia es sutil pero crítica: AND reduce, OR amplía. Ante la duda, prueba ambos y observa cuántas filas quedan.
Casos de uso
Aislar región o sucursal. Un CSV con ventas nacionales, filtras por “sucursal = Santiago Centro” y obtienes el subset para análisis focal.
Detectar outliers. Un CSV de transacciones con miles de filas. Filtrar por “monto > 10.000.000” trae los casos inusuales para revisión manual.
Extraer data de un período. Columna fecha en formato ISO (2026-04-22). Filtro “empieza con 2026-04” trae todo abril. Para rangos más finos, conviene convertir fecha a timestamp primero.
Limpiar filas vacías. Datasets importados suelen tener filas parcialmente vacías por errores de export. Filtrar “rut no está vacío” deja solo filas útiles.
Encontrar duplicados parciales. Si tienes un CSV con sospecha de duplicados en email, filtrá por “email = valor” y ves todas las apariciones.
Casos en Chile
Filtrar DTEs por folio o RUT. Libros de ventas del SII con miles de documentos. Filtrar por RUT de cliente específico o rango de folios para revisión.
Segmentar clientes por región. Base de contactos con comuna. Filtrar por “comuna contiene Santiago” para campaña localizada.
Auditoría de facturas. CSVs de contabilidad filtrados por “monto > X” identifican transacciones de alto valor para validación.
Control de stock. Inventario exportado con columna “stock”. Filtro “stock < 10” identifica productos a reponer.
Segmentación por Ley 19.628. Para extraer solo los clientes que autorizaron uso de datos con fines de marketing: filtro “consentimiento = SI”.
Power BI, Excel o herramienta web
Distintas situaciones requieren distintas herramientas:
- Excel: bueno para datasets de hasta ~100k filas. Los auto-filtros nativos son intuitivos. Pero abrir un CSV grande puede colgar Excel y subir data sensible a OneDrive es un riesgo.
- Power BI / Tableau: para análisis exploratorio complejo con múltiples dimensiones, drill-downs, gráficos. Si solo quieres extraer un subset, es overkill.
- Pandas / Python: máxima flexibilidad, pero requiere programar. Para filtros ad-hoc no vale el setup.
- Herramienta web (esta): sweet spot para filtros rápidos, archivos hasta 50 MB, sin preocupación por subir datos sensibles, sin necesidad de scripts.
Errores comunes
Filtro no matchea porque hay espacios. “Santiago ” (con espacio al final) no es igual a “Santiago”. Usa “contiene Santiago” para evitar, o limpia espacios en el CSV antes.
Filtro numérico con decimales. Si tu columna tiene “1.500,50” (formato chileno), interpretamos la coma como decimal y el punto como miles, dando 1500.5. Si tiene “1,500.50” (formato anglo), la coma se trata como miles. En datasets mixtos puede fallar — uniforma antes.
Case sensitivity inconsistente. “es igual a” es sensible, “contiene” no. Si quieres exactitud case-insensitive, usa “contiene X y no contiene Y” como combinación.
Delimitador del CSV mal detectado. Si el CSV tiene mezcla rara de delimitadores, el parser puede fallar. Prueba abrir con CSV a Excel primero y reexportar con delimitador consistente.
Privacidad
Todo el procesamiento ocurre en tu navegador. El CSV con información sensible — clientes, contactos, transacciones, empleados — nunca sale de tu dispositivo. Particularmente importante para equipos que manejan datos personales sujetos a Ley 19.628.
Relacionadas
- Combinar CSVs — unir antes o después de filtrar.
- Comparar CSVs — qué cambió entre versiones.
- CSV a Excel — entregar el filtrado como XLSX.
Preguntas frecuentes
¿Qué condiciones soporta?
Igualdad, inequidad, contiene, no contiene, empieza con, termina con, está vacío, no está vacío. Para columnas numéricas: mayor que, menor que, entre dos valores. Puedes combinar múltiples filtros con AND (todos deben cumplir) u OR (al menos uno).
¿Case-sensitive o no?
Las comparaciones de texto ('contiene', 'empieza con', etc.) son case-insensitive: 'Santiago' matchea 'santiago'. Si necesitas comparación exacta, usa 'es igual a' — ese sí es sensible al caso. Para regex o lógicas complejas conviene pandas/Python.
¿Cómo funciona 'entre'?
Rango numérico inclusivo. 'Entre 100 y 500' selecciona filas donde la columna numérica es >=100 y <=500. Si los valores no son números se ignoran (no cuelga — simplemente no matchean).
¿Puedo filtrar por fecha?
Indirectamente. Si tu columna de fecha está en formato ISO (2026-04-22), las operaciones 'empieza con' o 'contiene' funcionan: 'empieza con 2026-04' trae todo abril. Para rangos de fecha exactos, conviene convertir la fecha a número (timestamp) primero con un script.
¿Modifica el archivo original?
No. Se genera un CSV nuevo con solo las filas que matchean. El CSV original no se toca — siempre puedes volver a filtrar con otros criterios sin perder la data.
¿Los datos se suben a algún servidor?
No. Parseo y filtrado ocurren en tu navegador con papaparse. Para CSVs con información sensible (bases de datos de clientes, reportes internos), es la opción segura.