light-2403-persian/doxygen/train__model_8py_source.html

 #!/usr/bin/env python


 import logging

 import sys

 from pathlib import Path

 import click

 import torch

 import ignite as ig

 import numpy as np

 import random

 from grafei.model.config import load_config

 from grafei.model.dataset_split import create_dataloader_mode_tags

 from grafei.model.geometric_network import GraFEIModel

 from grafei.model.multiTrain import MultiTrainLoss

 from grafei.model.create_trainer import GraFEIIgniteTrainer


 @click.command()

 @click.option(
    "-c",
    "--config",
    "cfg_path",
    required=True,
    type=click.Path(exists=True),

     help="path to config file",

 )

 @click.option(
    "-n",
    "--n_samples",
    "n_samples",
    required=False,
    type=int,
    help="Number of samples to train on",
)

 @click.option("--quiet", "log_level", flag_value=logging.WARNING, default=True)

 @click.option("-v", "--verbose", "log_level", flag_value=logging.INFO)

 @click.option("-vv", "--very-verbose", "log_level", flag_value=logging.DEBUG)

 def main(

     cfg_path: Path,

     n_samples: int,

     log_level: int,

 ):

     """"""

     logging.basicConfig(

         stream=sys.stdout,

         level=log_level,

         datefmt="%Y-%m-%d %H:%M",

         format="%(asctime)s - %(name)s - %(levelname)s - %(message)s",

     )


     # First figure out which device all this is running on

     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

     print(f"Using {str(device).upper()} device\n")


     # Load configs

     configs, tags = load_config(

         Path(cfg_path).resolve(),

         samples=n_samples,

     )


     # Random seed

     if configs["train"]["seed"]:

         seed = configs["train"]["seed"]

         random.seed(seed)

         np.random.seed(seed)

         torch.manual_seed(seed)

         torch.cuda.manual_seed_all(seed)


     # Load datasets

     mode_tags = create_dataloader_mode_tags(configs, tags)


     # Find out if we are reconstructing B or Ups

     B_reco = mode_tags["Training"][1].B_reco


     configs["model"].update({"edge_classes": 6 if B_reco else 7, "B_reco": B_reco})


     # Now build the model

     # Extract the number of features, assuming last dim is features

     n_infeatures = mode_tags["Training"][1][0].x.shape[-1]

     e_infeatures = mode_tags["Training"][1][0].edge_attr.shape[-1]

     g_infeatures = mode_tags["Training"][1][0].u.shape[-1]


     base_model = GraFEIModel(

         nfeat_in_dim=n_infeatures,

         efeat_in_dim=e_infeatures,

         gfeat_in_dim=g_infeatures,

         **configs["model"],

     )


     print(f"Model: {base_model}\n")

     print(

         f"Number of model parameters: {sum(p.numel() for p in base_model.parameters() if p.requires_grad)}\n"

     )

     print(f"Using LCAS format, max depth of {5 if B_reco else 6} corresponding to {'B' if B_reco else 'Upsilon(4S)'}\n")


     # Compile the model (requires PyTorch >= 2.0.0)

     if float(torch.__version__[0]) >= 2 and configs["train"]["compile_model"]:

         print("Compiling the model!")

         model = torch.compile(base_model)

     else:

         model = base_model


     # Send the model to specific device

     model.to(device)


     # Set the loss

     loss_fn = MultiTrainLoss(

         ignore_index=-1,

         reduction=configs["model"]["loss_reduction"],

         alpha_mass=configs["model"]["alpha_mass"],

     )


     # Set the optimiser

     optimizer = torch.optim.Adam(

         model.parameters(),

         configs["train"]["learning_rate"],

         weight_decay=0,

         amsgrad=False,

         eps=0.001,

     )


     scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(

         optimizer=optimizer,

         T_max=10,

     ) if configs["train"]["lr_scheduler"] else None


     grafei_ignite_trainer = GraFEIIgniteTrainer(

         model=model,

         optimizer=optimizer,

         loss_fn=loss_fn,

         device=device,

         configs=configs,

         tags=list(mode_tags.keys()),

         scheduler=scheduler,

         ignore_index=-1,

     )


     # Set up the actual checkpoints and save the configs if requested

     grafei_ignite_trainer.setup_handlers(

         cfg_filename=Path(cfg_path).name,

     )


     # Add callback to run evaluation after each epoch

     grafei_ignite_trainer.trainer.add_event_handler(

         ig.engine.Events.EPOCH_COMPLETED,

         grafei_ignite_trainer.log_results,

         mode_tags,

     )


     # Actually run the training, mode_tags calls the train_loader

     train_steps = configs["train"]["steps"] if "steps" in configs["train"] else None

     grafei_ignite_trainer.trainer.run(

         mode_tags["Training"][2],

         max_epochs=configs["train"]["epochs"],

         epoch_length=train_steps,

     )


 if __name__ == "__main__":

     main()

 main
Definition: main.py:1

main
int main(int argc, char **argv)
Run all tests.
Definition: test_main.cc:91