31 lines
783 B
Python
31 lines
783 B
Python
# unir_y_analizar_csv.py
|
|
"""
|
|
Une todos los CSV de partidos en uno solo y analiza la cantidad de datos.
|
|
"""
|
|
import os
|
|
import pandas as pd
|
|
from glob import glob
|
|
|
|
BASE_DIR = os.path.join(os.path.dirname(__file__), '../data/espana')
|
|
SALIDA = os.path.join(BASE_DIR, 'partidos_todos.csv')
|
|
|
|
# Buscar todos los CSV de partidos
|
|
csvs = glob(os.path.join(BASE_DIR, '*', '*.csv'))
|
|
|
|
# Unir todos los CSV
|
|
dfs = []
|
|
for csv_file in csvs:
|
|
df = pd.read_csv(csv_file)
|
|
dfs.append(df)
|
|
|
|
df_total = pd.concat(dfs, ignore_index=True)
|
|
df_total.to_csv(SALIDA, index=False)
|
|
|
|
# Análisis básico
|
|
total_partidos = len(df_total)
|
|
print(f"Total de partidos: {total_partidos}")
|
|
print("Primeras filas:")
|
|
print(df_total.head())
|
|
print("Distribución de resultados:")
|
|
print(df_total['resultado'].value_counts())
|