`utils`¶

`save_forecaster(forecaster, file_name, verbose=True)` ¶

Save forecaster model using joblib.

Parameters:

Name	Type	Description	Default
`forecaster`	`forecaster object from skforecast library.`	Model created with skforecast library.	required
`file_name`	`str`	File name given to the object.	required
`verbose`	`bool`	Print info about the forecaster saved	`True`

Source code in skforecast/utils/utils.py

def save_forecaster(
    forecaster, 
    file_name: str, 
    verbose: bool=True
) -> None:
    """
    Save forecaster model using joblib.

    Parameters
    ----------
    forecaster: forecaster object from skforecast library.
        Model created with skforecast library.

    file_name: str
        File name given to the object.

    verbose: bool, default `True`
        Print info about the forecaster saved

    Returns 
    -------
    None

    """

    joblib.dump(forecaster, filename=file_name)

    if verbose:
        forecaster.summary()

`load_forecaster(file_name, verbose=True)` ¶

Load forecaster model from disc using joblib.

Parameters:

Name	Type	Description	Default
`forecaster`	`forecaster object from skforecast library.`	Forecaster created with skforecast library.	required
`file_name`	`str`	File name given to the object.	required
`verbose`	`bool`	Print summary about the forecaster loaded.	`True`

Returns:

Type	Description
`Forecaster`	Forecaster created with skforecast library.

Source code in skforecast/utils/utils.py

def load_forecaster(
    file_name: str,
    verbose: bool=True
):
    """
    Load forecaster model from disc using joblib.

    Parameters
    ----------
    forecaster: forecaster object from skforecast library.
        Forecaster created with skforecast library.

    file_name: str
        File name given to the object.

    verbose: bool, default `True`
        Print summary about the forecaster loaded.

    Returns 
    -------
    Forecaster
        Forecaster created with skforecast library.

    """

    forecaster = joblib.load(filename=file_name)

    if verbose:
        forecaster.summary()

    return forecaster

`check_y(y)` ¶

Raise Exception if y is not pandas Series or if it has missing values.

Parameters:

Name	Type	Description	Default
`y`	`Any`	Time series values.	required
`Returns`	`None`		required
`----------`	`None`		required
`None`	`None`		required

Source code in skforecast/utils/utils.py

def check_y(
    y: Any
) -> None:
    """
    Raise Exception if `y` is not pandas Series or if it has missing values.

    Parameters
    ----------        
    y : Any
        Time series values.

    Returns
    ----------
    None

    """

    if not isinstance(y, pd.Series):
        raise Exception('`y` must be a pandas Series.')

    if y.isnull().any():
        raise Exception('`y` has missing values.')

    return

`check_exog(exog)` ¶

Raise Exception if exog is not pandas Series or DataFrame, or

if it has missing values.

Parameters:

Name	Type	Description	Default
`exog`	`Any`	Exogenous variable/s included as predictor/s.	required
`Returns`	`None`		required
`----------`	`None`		required
`None`	`None`		required

Source code in skforecast/utils/utils.py

def check_exog(
    exog: Any
) -> None:
    """
    Raise Exception if `exog` is not pandas Series or DataFrame, or
    if it has missing values.

    Parameters
    ----------        
    exog :  Any
        Exogenous variable/s included as predictor/s.

    Returns
    ----------
    None

    """

    if not isinstance(exog, (pd.Series, pd.DataFrame)):
        raise Exception('`exog` must be `pd.Series` or `pd.DataFrame`.')

    if exog.isnull().any().any():
        raise Exception('`exog` has missing values.')

    return

`check_predict_input(forecaster_type, steps, fitted, included_exog, index_type, index_freq, window_size, last_window=None, exog=None, exog_type=None, exog_col_names=None, interval=None, max_steps=None, level=None, series_levels=None)` ¶

Check all inputs of predict method. This is a helper function to validate

that inputs used in predict method match attributes of a forecaster already trained.

Parameters:

Name	Type	Description	Default
`forecaster_type`	`ForecasterAutoreg, ForecasterAutoregCustom,`		required
`ForecasterAutoregDirect, ForecasterAutoregMultiOutput, ForecasterAutoregMultiSeries`	`None`	Forcaster type.	required
`steps`	`int`	Number of future steps predicted.	required
`fitted`	`bool`	Tag to identify if the regressor has been fitted (trained).	required
`included_exog`	`bool`	If the forecaster has been trained using exogenous variable/s.	required
`index_type`	`type`	Type of index of the input used in training.	required
`index_freq`	`str`	Frequency of Index of the input used in training.	required
`window_size`	`int`	Size of the window needed to create the predictors. It is equal to `max_lag`.	required
`last_window`	`Union[pandas.core.series.Series, pandas.core.frame.DataFrame]`	Values of the series used to create the predictors (lags) need in the first iteration of prediction (t + 1).	`None`
`exog`	`Union[pandas.core.series.Series, pandas.core.frame.DataFrame]`	Exogenous variable/s included as predictor/s.	`None`
`exog_type`	`Optional[type]`	Type of exogenous variable/s used in training.	`None`
`exog_col_names`	`Optional[list]`	Names of columns of `exog` if `exog` used in training was a pandas DataFrame.	`None`
`interval`	`list`	Confidence of the prediction interval estimated. Sequence of percentiles to compute, which must be between 0 and 100 inclusive. For example, interval of 95% should be as `interval = [2.5, 97.5]`.	`None`
`max_steps`	`int`	Maximum number of steps allowed.	`None`
`level`	`str`	Time series to be predicted.	`None`
`series_levels`	`list`	Names of the columns (levels) that can be predicted.	`None`

Source code in skforecast/utils/utils.py

def check_predict_input(
    forecaster_type,
    steps: int,
    fitted: bool,
    included_exog: bool,
    index_type: type,
    index_freq: str,
    window_size: int,
    last_window: Union[pd.Series, pd.DataFrame]=None,
    exog: Union[pd.Series, pd.DataFrame]=None,
    exog_type: Union[type, None]=None,
    exog_col_names: Union[list, None]=None,
    interval: list=None,
    max_steps: int=None,
    level: str=None,
    series_levels: list=None
) -> None:
    """
    Check all inputs of predict method. This is a helper function to validate
    that inputs used in predict method match attributes of a forecaster already
    trained.

    Parameters
    ----------
    forecaster_type : ForecasterAutoreg, ForecasterAutoregCustom, 
    ForecasterAutoregDirect, ForecasterAutoregMultiOutput, ForecasterAutoregMultiSeries
        Forcaster type.

    steps : int
        Number of future steps predicted.

    fitted: Bool
        Tag to identify if the regressor has been fitted (trained).

    included_exog : bool
        If the forecaster has been trained using exogenous variable/s.

    index_type : type
        Type of index of the input used in training.

    index_freq : str
        Frequency of Index of the input used in training.

    window_size: int
        Size of the window needed to create the predictors. It is equal to
        `max_lag`.

    last_window : pandas Series, pandas DataFrame, default `None`
        Values of the series used to create the predictors (lags) need in the 
        first iteration of prediction (t + 1).

    exog : pandas Series, pandas DataFrame, default `None`
        Exogenous variable/s included as predictor/s.

    exog_type : type, default `None`
        Type of exogenous variable/s used in training.

    exog_col_names : list, default `None`
        Names of columns of `exog` if `exog` used in training was a pandas
        DataFrame.

    interval : list, default `None`
        Confidence of the prediction interval estimated. Sequence of percentiles
        to compute, which must be between 0 and 100 inclusive. For example, 
        interval of 95% should be as `interval = [2.5, 97.5]`.

    max_steps: int, default `None`
        Maximum number of steps allowed.

    level : str, default `None`
        Time series to be predicted.

    series_levels : list, default `None`
        Names of the columns (levels) that can be predicted.

    """

    if not fitted:
        raise Exception(
            'This Forecaster instance is not fitted yet. Call `fit` with '
            'appropriate arguments before using predict.'
        )

    if steps < 1:
        raise ValueError(
            f'`steps` must be integer greater than 0. Got {steps}.'
        )

    if max_steps is not None:
        if steps > max_steps:
            raise ValueError(
                f'`steps` must be lower or equal to the value of steps defined '
                f'when initializing the forecaster. Got {steps} but the maximum '
                f'is {max_steps}.'
            )

    if interval is not None:
        _check_interval(interval = interval)

    if str(forecaster_type).split('.')[1] == 'ForecasterAutoregMultiSeries':
        if level not in series_levels:
            raise ValueError(
                f'`level` must be one of the `series_levels` : {series_levels}'
            )

    if exog is None and included_exog:
        raise Exception(
            'Forecaster trained with exogenous variable/s. '
            'Same variable/s must be provided in `predict()`.'
        )

    if exog is not None and not included_exog:
        raise Exception(
            'Forecaster trained without exogenous variable/s. '
            '`exog` must be `None` in `predict()`.'
        )

    if exog is not None:
        if len(exog) < steps:
            raise ValueError(
                '`exog` must have at least as many values as `steps` predicted.'
            )
        if not isinstance(exog, (pd.Series, pd.DataFrame)):
            raise TypeError('`exog` must be a pandas Series or DataFrame.')
        if exog.isnull().values.any():
            raise ValueError('`exog` has missing values.')
        if not isinstance(exog, exog_type):
            raise TypeError(
                f'Expected type for `exog`: {exog_type}. Got {type(exog)}'     
            )
        if isinstance(exog, pd.DataFrame):
            col_missing = set(exog_col_names).difference(set(exog.columns))
            if col_missing:
                raise ValueError(
                    f'Missing columns in `exog`. Expected {exog_col_names}. '
                    f'Got {exog.columns.to_list()}'     
                )
        check_exog(exog = exog)
        _, exog_index = preprocess_exog(exog=exog.iloc[:0, ])

        if not isinstance(exog_index, index_type):
            raise TypeError(
                f'Expected index of type {index_type} for `exog`. '
                f'Got {type(exog_index)}'
            )

        if isinstance(exog_index, pd.DatetimeIndex):
            if not exog_index.freqstr == index_freq:
                raise TypeError(
                    f'Expected frequency of type {index_freq} for `exog`. '
                    f'Got {exog_index.freqstr}'
                )

    if last_window is not None:
        if len(last_window) < window_size:
                raise ValueError(
                    f'`last_window` must have as many values as as needed to '
                    f'calculate the predictors. For this forecaster it is {window_size}.'
                )

        if str(forecaster_type).split('.')[1] == 'ForecasterAutoregMultiSeries':
            if isinstance(last_window, pd.DataFrame) and level not in last_window.columns:
                raise ValueError(
                    f'''
                    Level {level} not found in `last_window`. If `last_window` is a pandas
                    DataFrame, it must contain a column named as level.
                    '''
                )
            elif isinstance(last_window, pd.Series):
                if last_window.name is None:
                    Warning.warn(
                        f'''
                        Provided `last_window` has no name, ensure that it contains data
                        for {level}.
                        '''
                    )
                if last_window.name != level:
                    Warning.warn(
                        f'''
                        Provided `last_window` has name {last_window.name} and predicted
                        level is {level}. Ensure that it contains data for {level}.
                        '''
                    )
            else:
                raise TypeError('`last_window` must be a pandas Series or DataFrame.')

        else:    
            if not isinstance(last_window, pd.Series):
                raise TypeError('`last_window` must be a pandas Series.')

        if last_window.isnull().any().all():
            raise ValueError('`last_window` has missing values.')
        _, last_window_index = preprocess_last_window(
                                    last_window = last_window.iloc[:0]
                                ) 
        if not isinstance(last_window_index, index_type):
            raise TypeError(
                f'Expected index of type {index_type} for `last_window`. '
                f'Got {type(last_window_index)}'
            )
        if isinstance(last_window_index, pd.DatetimeIndex):
            if not last_window_index.freqstr == index_freq:
                raise TypeError(
                    f'Expected frequency of type {index_freq} for `last_window`. '
                    f'Got {last_window_index.freqstr}'
                )

    return

`preprocess_y(y)` ¶

Returns values and index of series separately. Index is overwritten

according to the next rules: If index is of type DatetimeIndex and has frequency, nothing is changed. If index is of type RangeIndex, nothing is changed. If index is of type DatetimeIndex but has no frequency, a RangeIndex is created. If index is not of type DatetimeIndex, a RangeIndex is created.

Parameters:

Name	Type	Description	Default
`y`	`Series`	Time series.	required

Returns:

Type	Description
`Union[numpy.ndarray, pandas.core.indexes.base.Index]`	Numpy array with values of `y`.

Source code in skforecast/utils/utils.py

def preprocess_y(
    y: pd.Series
) -> Union[np.ndarray, pd.Index]:
    """
    Returns values and index of series separately. Index is overwritten 
    according to the next rules:
        If index is of type DatetimeIndex and has frequency, nothing is 
        changed.
        If index is of type RangeIndex, nothing is changed.
        If index is of type DatetimeIndex but has no frequency, a 
        RangeIndex is created.
        If index is not of type DatetimeIndex, a RangeIndex is created.

    Parameters
    ----------        
    y : pandas Series
        Time series.

    Returns 
    -------
    y_values : numpy ndarray
        Numpy array with values of `y`.

    y_index : pandas Index
        Index of `y` modified according to the rules.

    """

    if isinstance(y.index, pd.DatetimeIndex) and y.index.freq is not None:
        y_index = y.index
    elif isinstance(y.index, pd.RangeIndex):
        y_index = y.index
    elif isinstance(y.index, pd.DatetimeIndex) and y.index.freq is None:
        warnings.warn(
            '`y` has DatetimeIndex index but no frequency. '
            'Index is overwritten with a RangeIndex of step 1.'
        )
        y_index = pd.RangeIndex(
                    start = 0,
                    stop  = len(y),
                    step  = 1
                    )
    else:
        warnings.warn(
            '`y` has no DatetimeIndex nor RangeIndex index. Index is overwritten with a RangeIndex.'
        )
        y_index = pd.RangeIndex(
                    start = 0,
                    stop  = len(y),
                    step  = 1
                    )

    y_values = y.to_numpy()

    return y_values, y_index

`preprocess_last_window(last_window)` ¶

Returns values and index of series separately. Index is overwritten

according to the next rules: If index is of type DatetimeIndex and has frequency, nothing is changed. If index is of type RangeIndex, nothing is changed. If index is of type DatetimeIndex but has no frequency, a RangeIndex is created. If index is not of type DatetimeIndex, a RangeIndex is created.

Parameters:

Name	Type	Description	Default
`last_window`	`Union[pandas.core.series.Series, pandas.core.frame.DataFrame]`	Time series values.	required

Returns:

Type	Description
`Union[numpy.ndarray, pandas.core.indexes.base.Index]`	Numpy array with values of `last_window`.

Source code in skforecast/utils/utils.py

def preprocess_last_window(
    last_window:Union[pd.Series, pd.DataFrame]
 ) -> Union[np.ndarray, pd.Index]:
    """
    Returns values and index of series separately. Index is overwritten 
    according to the next rules:
        If index is of type DatetimeIndex and has frequency, nothing is 
        changed.
        If index is of type RangeIndex, nothing is changed.
        If index is of type DatetimeIndex but has no frequency, a 
        RangeIndex is created.
        If index is not of type DatetimeIndex, a RangeIndex is created.

    Parameters
    ----------        
    last_window : pandas Series, pandas DataFrame
        Time series values.

    Returns 
    -------
    last_window_values : numpy ndarray
        Numpy array with values of `last_window`.

    last_window_index : pandas Index
        Index of `last_window` modified according to the rules.

    """

    if isinstance(last_window.index, pd.DatetimeIndex) and last_window.index.freq is not None:
        last_window_index = last_window.index
    elif isinstance(last_window.index, pd.RangeIndex):
        last_window_index = last_window.index
    elif isinstance(last_window.index, pd.DatetimeIndex) and last_window.index.freq is None:
        warnings.warn(
            '`last_window` has DatetimeIndex index but no frequency. '
            'Index is overwritten with a RangeIndex of step 1.'
        )
        last_window_index = pd.RangeIndex(
                                start = 0,
                                stop  = len(last_window),
                                step  = 1
                                )
    else:
        warnings.warn(
            '`last_window` has no DatetimeIndex nor RangeIndex index. Index is overwritten with a RangeIndex.'
        )
        last_window_index = pd.RangeIndex(
                                start = 0,
                                stop  = len(last_window),
                                step  = 1
                                )

    last_window_values = last_window.to_numpy()

    return last_window_values, last_window_index

`preprocess_exog(exog)` ¶

Returns values and index of series separately. Index is overwritten

according to the next rules: If index is of type DatetimeIndex and has frequency, nothing is changed. If index is of type RangeIndex, nothing is changed. If index is of type DatetimeIndex but has no frequency, a RangeIndex is created. If index is not of type DatetimeIndex, a RangeIndex is created.

Parameters:

Name	Type	Description	Default
`exog`	`Union[pandas.core.series.Series, pandas.core.frame.DataFrame]`	Exogenous variables.	required

Returns:

Type	Description
`Union[numpy.ndarray, pandas.core.indexes.base.Index]`	Numpy array with values of `exog`.

Source code in skforecast/utils/utils.py

def preprocess_exog(
    exog: Union[pd.Series, pd.DataFrame]
) -> Union[np.ndarray, pd.Index]:
    """
    Returns values and index of series separately. Index is overwritten 
    according to the next rules:
        If index is of type DatetimeIndex and has frequency, nothing is 
        changed.
        If index is of type RangeIndex, nothing is changed.
        If index is of type DatetimeIndex but has no frequency, a 
        RangeIndex is created.
        If index is not of type DatetimeIndex, a RangeIndex is created.

    Parameters
    ----------        
    exog : pandas Series, pandas DataFrame
        Exogenous variables.

    Returns 
    -------
    exog_values : numpy ndarray
        Numpy array with values of `exog`.

    exog_index : pandas Index
        Index of `exog` modified according to the rules.

    """

    if isinstance(exog.index, pd.DatetimeIndex) and exog.index.freq is not None:
        exog_index = exog.index
    elif isinstance(exog.index, pd.RangeIndex):
        exog_index = exog.index
    elif isinstance(exog.index, pd.DatetimeIndex) and exog.index.freq is None:
        warnings.warn(
            '`exog` has DatetimeIndex index but no frequency. '
            'Index is overwritten with a RangeIndex of step 1.'
        )
        exog_index = pd.RangeIndex(
                        start = 0,
                        stop  = len(exog),
                        step  = 1
                        )

    else:
        warnings.warn(
            '`exog` has no DatetimeIndex nor RangeIndex index. Index is overwritten with a RangeIndex.'
        )
        exog_index = pd.RangeIndex(
                        start = 0,
                        stop  = len(exog),
                        step  = 1
                        )

    exog_values = exog.to_numpy()

    return exog_values, exog_index

`exog_to_multi_output(exog, steps)` ¶

Transforms exog to np.ndarray with the shape needed for multioutput

regresors.

Parameters:

Name	Type	Description	Default
`exog`	`ndarray`	Time series values.	required
`steps`	`int`	Number of steps that will be predicted using this exog.	required

Returns:

Type	Description
`ndarray`

Source code in skforecast/utils/utils.py

def exog_to_multi_output(
    exog: np.ndarray,
    steps: int
)-> np.ndarray:
    """
    Transforms `exog` to `np.ndarray` with the shape needed for multioutput
    regresors.

    Parameters
    ----------        
    exog : numpy ndarray, shape(samples,)
        Time series values.

    steps : int.
        Number of steps that will be predicted using this exog.

    Returns 
    -------
    exog_transformed : numpy ndarray

    """

    exog_transformed = []

    if exog.ndim < 2:
        exog = exog.reshape(-1, 1)

    for column in range(exog.shape[1]):

        exog_column_transformed = []

        for i in range(exog.shape[0] - (steps -1)):
            exog_column_transformed.append(exog[i:i + steps, column])

        if len(exog_column_transformed) > 1:
            exog_column_transformed = np.vstack(exog_column_transformed)

        exog_transformed.append(exog_column_transformed)

    if len(exog_transformed) > 1:
        exog_transformed = np.hstack(exog_transformed)
    else:
        exog_transformed = exog_column_transformed

    return exog_transformed

`expand_index(index, steps)` ¶

Create a new index of lenght steps starting and the end of index.

Parameters:

Name	Type	Description	Default
`index`	`Optional[pandas.core.indexes.base.Index]`	Index of last window.	required
`steps`	`int`	Number of steps to expand.	required

Returns:

Type	Description
`Index`

Source code in skforecast/utils/utils.py

def expand_index(
    index: Union[pd.Index, None], 
    steps: int
) -> pd.Index:
    """
    Create a new index of lenght `steps` starting and the end of index.

    Parameters
    ----------        
    index : pd.Index, None
        Index of last window.
    steps : int
        Number of steps to expand.

    Returns 
    -------
    new_index : pd.Index

    """

    if isinstance(index, pd.Index):

        if isinstance(index, pd.DatetimeIndex):
            new_index = pd.date_range(
                            index[-1] + index.freq,
                            periods = steps,
                            freq    = index.freq
                        )
        elif isinstance(index, pd.RangeIndex):
            new_index = pd.RangeIndex(
                            start = index[-1] + 1,
                            stop  = index[-1] + 1 + steps
                        )
    else: 
        new_index = pd.RangeIndex(
                        start = 0,
                        stop  = steps
                     )
    return new_index

`transform_series(series, transformer, fit=False, inverse_transform=False)` ¶

Transform raw values of pandas Series with a scikit-learn alike transformer

(preprocessor). The transformer used must have the following methods: fit, transform, fit_transform and inverse_transform. ColumnTransformers are not allowed since they do not have inverse_transform method.

Parameters:

Name	Type	Description	Default
`series`	`Series`		required
`transformer`	`scikit-learn alike transformer (preprocessor).`	scikit-learn alike transformer (preprocessor) with methods: fit, transform, fit_transform and inverse_transform. ColumnTransformers are not allowed since they do not have inverse_transform method.	required
`fit`	`bool`	Train the transformer before applying it.	`False`
`inverse_transform`	`bool`	Transform back the data to the original representation.	`False`

Returns:

Type	Description
`Union[pandas.core.series.Series, pandas.core.frame.DataFrame]`	Transformed Series. Depending on the transformer used, the output may be a Series or a DataFrame.

Source code in skforecast/utils/utils.py

def transform_series(
    series: pd.Series,
    transformer,
    fit: bool=False,
    inverse_transform: bool=False
) -> Union[pd.Series, pd.DataFrame]:
    """      
    Transform raw values of pandas Series with a scikit-learn alike transformer
    (preprocessor). The transformer used must have the following methods: fit, transform,
    fit_transform and inverse_transform. ColumnTransformers are not allowed since they
    do not have inverse_transform method.

    Parameters
    ----------
    series : pandas Series

    transformer : scikit-learn alike transformer (preprocessor).
        scikit-learn alike transformer (preprocessor) with methods: fit, transform,
        fit_transform and inverse_transform. ColumnTransformers are not allowed since they
        do not have inverse_transform method.

    fit : bool, default `False`
        Train the transformer before applying it.

    inverse_transform : bool, default `False`
        Transform back the data to the original representation.

    Returns
    -------
    series_transformed : pandas Series, pandas DataFrame
        Transformed Series. Depending on the transformer used, the output may be a Series
        or a DataFrame.

    """

    if not isinstance(series, pd.Series):
        raise Exception(
            "Series argument must be a pandas Series object."
        )

    if transformer is None:
        return series

    series = series.to_frame()

    if fit and not isinstance(transformer, sklearn.preprocessing._function_transformer.FunctionTransformer):
        transformer.fit(series)

    if inverse_transform:
        values_transformed = transformer.inverse_transform(series)
    else:
        values_transformed = transformer.transform(series)   

    if hasattr(values_transformed, 'toarray'):
        # If the returned values are in sparse matrix format, it is converted to dense array.
        values_transformed = values_transformed.toarray()

    if isinstance(values_transformed, np.ndarray) and values_transformed.shape[1] == 1:
        series_transformed = pd.Series(
                                data  = values_transformed.flatten(),
                                index = series.index,
                                name  = series.columns[0]
                            )
    elif isinstance(values_transformed, pd.DataFrame) and values_transformed.shape[1] == 1:
        series_transformed = values_transformed.squeeze()
    else:
        series_transformed = pd.DataFrame(
                                data = values_transformed,
                                index = series.index,
                                columns = transformer.get_feature_names_out()
                             )

    return series_transformed

`transform_dataframe(df, transformer, fit=False, inverse_transform=False)` ¶

Transform raw values of pandas DataFrame with a scikit-learn alike

transformer, preprocessor or ColumnTransformer. inverse_transform is not available when using ColumnTransformers.

Parameters:

Name	Type	Description	Default
`series`	`pandas DataFrame`		required
`transformer`	`scikit-learn alike transformer, preprocessor or ColumnTransformer.`	scikit-learn alike transformer, preprocessor or ColumnTransformer.	required
`fit`	`bool`	Train the transformer before applying it.	`False`
`inverse_transform`	`bool`	Transform back the data to the original representation. This is not available when using transformers of class scikit-learn ColumnTransformers.	`False`

Returns:

Type	Description
`DataFrame`	Transformed DataFrame.

Source code in skforecast/utils/utils.py

def transform_dataframe(
    df: pd.DataFrame,
    transformer,
    fit: bool=False,
    inverse_transform: bool=False
) -> pd.DataFrame:
    """      
    Transform raw values of pandas DataFrame with a scikit-learn alike
    transformer, preprocessor or ColumnTransformer. `inverse_transform` is not available
    when using ColumnTransformers.

    Parameters
    ----------
    series : pandas DataFrame

    transformer : scikit-learn alike transformer, preprocessor or ColumnTransformer.
        scikit-learn alike transformer, preprocessor or ColumnTransformer.

    fit : bool, default `False`
        Train the transformer before applying it.

    inverse_transform : bool, default `False`
        Transform back the data to the original representation. This is not available
        when using transformers of class scikit-learn ColumnTransformers.

    Returns
    -------
    series_transformed : pandas DataFrame
        Transformed DataFrame.

    """

    if transformer is None:
        return df

    if inverse_transform and\
    isinstance(transformer, sklearn.compose._column_transformer.ColumnTransformer):
        raise Exception(
            '`inverse_transform` is not available when using ColumnTransformers.'
        )

    if not inverse_transform:
        if fit:
            values_transformed = transformer.fit_transform(df)
        else:
            values_transformed = transformer.transform(df)
    else:
        values_transformed = transformer.inverse_transform(df)

    if hasattr(values_transformed, 'toarray'):
        # If the returned values are in sparse matrix format, it is converted to dense
        values_transformed = values_transformed.toarray()

    if hasattr(transformer, 'get_feature_names_out'):
        feature_names_out = transformer.get_feature_names_out()
    elif hasattr(transformer, 'categories_'):   
        feature_names_out = transformer.categories_
    else:
        feature_names_out = df.columns

    df_transformed = pd.DataFrame(
                        data = values_transformed,
                        index = df.index,
                        columns = feature_names_out
                      )

    return df_transformed

utils¶

save_forecaster(forecaster, file_name, verbose=True) ¶

load_forecaster(file_name, verbose=True) ¶

check_y(y) ¶

check_exog(exog) ¶

check_predict_input(forecaster_type, steps, fitted, included_exog, index_type, index_freq, window_size, last_window=None, exog=None, exog_type=None, exog_col_names=None, interval=None, max_steps=None, level=None, series_levels=None) ¶

preprocess_y(y) ¶

preprocess_last_window(last_window) ¶

preprocess_exog(exog) ¶

exog_to_multi_output(exog, steps) ¶

expand_index(index, steps) ¶

transform_series(series, transformer, fit=False, inverse_transform=False) ¶

transform_dataframe(df, transformer, fit=False, inverse_transform=False) ¶

`utils`¶

`save_forecaster(forecaster, file_name, verbose=True)` ¶

`load_forecaster(file_name, verbose=True)` ¶

`check_y(y)` ¶

`check_exog(exog)` ¶

`check_predict_input(forecaster_type, steps, fitted, included_exog, index_type, index_freq, window_size, last_window=None, exog=None, exog_type=None, exog_col_names=None, interval=None, max_steps=None, level=None, series_levels=None)` ¶

`preprocess_y(y)` ¶

`preprocess_last_window(last_window)` ¶

`preprocess_exog(exog)` ¶

`exog_to_multi_output(exog, steps)` ¶

`expand_index(index, steps)` ¶

`transform_series(series, transformer, fit=False, inverse_transform=False)` ¶

`transform_dataframe(df, transformer, fit=False, inverse_transform=False)` ¶