quinielas/scripts/unir_y_analizar_csv.py

31 lines
783 B
Python

# unir_y_analizar_csv.py
"""
Une todos los CSV de partidos en uno solo y analiza la cantidad de datos.
"""
import os
import pandas as pd
from glob import glob
BASE_DIR = os.path.join(os.path.dirname(__file__), '../data/espana')
SALIDA = os.path.join(BASE_DIR, 'partidos_todos.csv')
# Buscar todos los CSV de partidos
csvs = glob(os.path.join(BASE_DIR, '*', '*.csv'))
# Unir todos los CSV
dfs = []
for csv_file in csvs:
df = pd.read_csv(csv_file)
dfs.append(df)
df_total = pd.concat(dfs, ignore_index=True)
df_total.to_csv(SALIDA, index=False)
# Análisis básico
total_partidos = len(df_total)
print(f"Total de partidos: {total_partidos}")
print("Primeras filas:")
print(df_total.head())
print("Distribución de resultados:")
print(df_total['resultado'].value_counts())