Preparación de los datos

Eliminar registros con NA

datos = datos.dropna()

Eliminar registros con 0 en la puntuación

datos = datos.loc[(datos.PTS_visita > 0) & (datos.PTS_local > 0), :]

Construir variable a predecir

datos["ganador"] = np.where(datos['PTS_local'] > datos['PTS_visita'], 'local', 'visita')

Transformar variable con la fecha por el mes

datos['fecha'] = [pd.to_datetime(x).month for x in datos['fecha']]

Eliminar columnas que no aportan

datos = datos.drop(columns=['id', 'pts', 'PTS_local', 'PTS_visita'])

Convertir a categórico.

datos['fecha'] = datos['fecha'].astype('category')
datos['lugar'] = datos['lugar'].astype('category')
datos['local'] = datos['local'].astype('category')
datos['away']  = datos['away'].astype('category')

Datos

datos.info()
<class 'pandas.core.frame.DataFrame'>
Index: 2590 entries, 14 to 2733
Data columns (total 29 columns):
 #   Column       Non-Null Count  Dtype   
---  ------       --------------  -----   
 0   fecha        2590 non-null   category
 1   lugar        2590 non-null   category
 2   local        2590 non-null   category
 3   away         2590 non-null   category
 4   MIN_local    2590 non-null   float64 
 5   FG_local     2590 non-null   float64 
 6   PT3_local    2590 non-null   float64 
 7   TL_local     2590 non-null   float64 
 8   OREB_local   2590 non-null   float64 
 9   DREB_local   2590 non-null   float64 
 10  REB_local    2590 non-null   float64 
 11  AST_local    2590 non-null   float64 
 12  STL_local    2590 non-null   float64 
 13  TOV_local    2590 non-null   float64 
 14  PF_local     2590 non-null   float64 
 15  PM_local     2590 non-null   float64 
 16  MIN_visita   2590 non-null   float64 
 17  FG_visita    2590 non-null   float64 
 18  PT3_visita   2590 non-null   float64 
 19  TL_visita    2590 non-null   float64 
 20  OREB_visita  2590 non-null   float64 
 21  DREB_visita  2590 non-null   float64 
 22  REB_visita   2590 non-null   float64 
 23  AST_visita   2590 non-null   float64 
 24  STL_visita   2590 non-null   float64 
 25  TOV_visita   2590 non-null   float64 
 26  PF_visita    2590 non-null   float64 
 27  PM_visita    2590 non-null   float64 
 28  ganador      2590 non-null   object  
dtypes: category(4), float64(24), object(1)
memory usage: 540.4+ KB