development/doxygen/lightgbm_8py_source.html

import numpy as np

import lightgbm as lgb

import os

import tempfile


class State(object):

    """

    LGBM state

    """


    def __init__(self, bst=None, params=None, X_valid=None, y_valid=None, path='LGBM.txt', trainFraction=0.8, num_round=100):

        """ Constructor of the state object """


        self.X_valid = X_valid


        self.y_valid = y_valid


        self.path = path


        self.params = params


        self.bst = bst


        self.trainFraction = trainFraction


def get_model(number_of_features, number_of_spectators, number_of_events, training_fraction, parameters):

    """

    Create and return a state object containing the model and other necessary functions

    """

    # hyper parameters for lgbm

    param = {'num_leaves': 31,

             'objective': 'regression',

             'learning_rate': 0.1,

             'device_type': "cpu",

             'deterministic': True,

             'metric': 'auc',

             'num_round': 100,

             'max_bin': 255,

             'boosting': "gbdt",

             'num_threads': 1

             }


    if isinstance(parameters, dict):

        param = {key: parameters[key] if key in param else value for key, value in param.items()}

    state = State(params=param, path=str(parameters['path']), trainFraction=float(

        parameters['trainFraction']))  # ,stop_round = int(parameters['stop_round']))

    return state


def begin_fit(state, Xtest, Stest, ytest, wtest, nBatches):

    """

    Begin fit, do nothing

    """

    return state


def feature_importance(state):

    """

    Return a list containing the feature importances

    """

    return state.bst.feature_importance('gain').tolist()


def partial_fit(state, X, S, y, w, epoch, batch):

    """

    Full fitting process:

        1.randomly shuffle data

        2.build LGBM dataset

        3.run training

    """

    # randomly split

    shuffled_indices = np.random.permutation(X.shape[0])

    split_index = int(X.shape[0] * state.trainFraction)


    state.train_set = lgb.Dataset(X[shuffled_indices[:split_index]],

                                  label=y[shuffled_indices[:split_index]],

                                  weight=w[shuffled_indices[:split_index]])


    state.validation_set = state.train_set.create_valid(

        X[shuffled_indices[split_index:]], label=y[shuffled_indices[split_index:]], weight=w[shuffled_indices[split_index:]])

    # Do training

    if (state.trainFraction != 1):

        state.bst = lgb.train(state.params, state.train_set, valid_sets=[state.validation_set])

    else:

        state.bst = lgb.train(state.params, state.train_set)

    del shuffled_indices

    return True


def end_fit(state):

    """

    End training process and write weights & hyperparameters into root file

    """

    with tempfile.TemporaryDirectory() as path:

        state.bst.save_model(os.path.join(path, state.path))

        file_names = [state.path]

        files = []

        for file_name in file_names:

            with open(os.path.join(path, file_name), 'rb') as file:

                files.append(file.read())

        params = state.params

    del state

    return [file_names, files, params]


def load(obj):

    """

    Load the trained model into state

    """

    with tempfile.TemporaryDirectory() as path:

        file_names = obj[0]

        for file_index, file_name in enumerate(file_names):

            with open(f'{path}/{file_name}', 'w+b') as file:

                file.write(bytes(obj[1][file_index]))


        bst = lgb.Booster(model_file=os.path.join(path, file_names[0]))  # init model

        state = State()

        state.bst = bst

        state.params = obj[2]

    return state


def apply(state, X):

    """

    Apply model to data and make prediction

    """

    outputs = state.bst.predict(X)

    return np.require(outputs, dtype=np.float32, requirements=['A', 'W', 'C', 'O'])

basf2_mva_python_interface.lightgbm.State
Definition: lightgbm.py:8

basf2_mva_python_interface.lightgbm.State.trainFraction
trainFraction
train fraction for dataset splitting
Definition: lightgbm.py:26

basf2_mva_python_interface.lightgbm.State.params
params
LightGBM Model parameter.
Definition: lightgbm.py:22

basf2_mva_python_interface.lightgbm.State.bst
bst
saved Best model
Definition: lightgbm.py:24

basf2_mva_python_interface.lightgbm.State.path
path
weights save path
Definition: lightgbm.py:20

basf2_mva_python_interface.lightgbm.State.X_valid
X_valid
X valid.
Definition: lightgbm.py:16

basf2_mva_python_interface.lightgbm.State.y_valid
y_valid
Y valid.
Definition: lightgbm.py:18

basf2_mva_python_interface.lightgbm.State.__init__
def __init__(self, bst=None, params=None, X_valid=None, y_valid=None, path='LGBM.txt', trainFraction=0.8, num_round=100)
Definition: lightgbm.py:13