unike.config.HPOTrainer 源代码

# coding:utf-8
#
# unike/config/HPOTrainer.py
#
# created by LuYF-Lemon-love <luyanfeng_nlp@qq.com> on Jan 2, 2024
# updated by LuYF-Lemon-love <luyanfeng_nlp@qq.com> on May 6, 2024
#
# 该脚本定义了并行训练循环函数.

"""
hpo_train - 超参数优化训练循环函数。
"""

import wandb
import typing
from ..utils import import_class
from ..module.model import TransE
from ..module.loss import MarginLoss
from ..module.strategy import NegativeSampling
from ..config import Trainer, Tester
from ..data import KGEDataLoader
from ..utils import WandbLogger
from loguru import logger
from typing import Literal, Any
import os


[文档]def set_hpo_config(
	method: str = 'bayes',
	sweep_name: str = 'unike_hpo',
	metric_name: str = 'val/hits@10',
	metric_goal: Literal['maximize', 'minimize'] = 'maximize',
	data_loader_config: dict[str, dict[str, typing.Any]] = {},
	kge_config: dict[str, dict[str, typing.Any]] = {},
	loss_config: dict[str, dict[str, typing.Any]] = {},
	strategy_config: dict[str, dict[str, typing.Any]] = {},
	tester_config: dict[str, dict[str, typing.Any]] = {},
	trainer_config: dict[str, dict[str, typing.Any]] = {}) -> dict[str, Any]:

	"""设置超参数优化范围。
	
	:param method: 超参数优化的方法，``grid`` 或 ``random`` 或 ``bayes``
	:type param: str
	:param sweep_name: 超参数优化 sweep 的名字
	:type sweep_name: str
	:param metric_name: 超参数优化的指标名字
	:type metric_name: str
	:param metric_goal: 超参数优化的指标目标，``maximize`` 或 ``minimize``
	:type metric_goal: str
	:param data_loader_config: :py:class:`unike.data.KGEDataLoader` 的超参数优化配置
	:type data_loader_config: dict
	:param kge_config: :py:class:`unike.module.model.Model` 的超参数优化配置
	:type kge_config: dict
	:param loss_config: :py:class:`unike.module.loss.Loss` 的超参数优化配置
	:type loss_config: dict
	:param strategy_config: :py:class:`unike.module.strategy.Strategy` 的超参数优化配置
	:type strategy_config: dict
	:param tester_config: :py:class:`unike.config.Tester` 的超参数优化配置
	:type tester_config: dict
	:param trainer_config: :py:class:`unike.config.Trainer` 的超参数优化配置
	:type trainer_config: dict
	:returns: 超参数优化范围
	:rtype: dict
	"""

	sweep_config: dict[str, Any] = {
		'method': method,
		'name': sweep_name
	}

	metric: dict[str, str] = {
		'name': metric_name,
		'goal': metric_goal
	}

	parameters_dict: dict[str, dict[str, typing.Any]] | None = {}
	parameters_dict.update(data_loader_config)
	parameters_dict.update(kge_config)
	parameters_dict.update(loss_config)
	parameters_dict.update(strategy_config)
	parameters_dict.update(tester_config)
	parameters_dict.update(trainer_config)

	sweep_config['metric'] = metric
	sweep_config['parameters'] = parameters_dict

	return sweep_config

[文档]def set_hpo_hits(
    new_hits: list[int] = [1, 3, 10]):
	
	"""设置 Hits 指标。
	
	:param new_hits: 准备报告的指标 Hit@N 的列表，默认为 [1, 3, 10], 表示报告 Hits@1, Hits@3, Hits@10
	:type new_hits: list[int]
    """
	
	tmp = Tester.hits
	Tester.hits = new_hits
	logger.info(f"Hits@N 指标由 {tmp} 变为 {Tester.hits}")

[文档]def start_hpo_train(
	config: dict[str, Any],
	project: str = "unike-sweeps",
	count: int = 2) -> None:

	"""开启超参数优化。
	
	:param config: wandb 的超参数优化配置。
	:type config: dict
	:param project: 项目名
	:type param: str
	:param count: 进行几次尝试。
	:type count: int
	"""
	wandb.login()

	sweep_id = wandb.sweep(config, project=project)

	wandb.agent(sweep_id, hpo_train, count=count)

[文档]def hpo_train(config: dict[str, Any] | None = None):

	"""超参数优化训练循环函数。
	
	:param config: wandb 的项目配置如超参数。
	:type config: dict[str, Any]
	"""
	
	with wandb.init(config = config):
		
		config_ = wandb.config

		# dataloader for training
		dataloader_class: type[KGEDataLoader] = import_class(f"unike.data.{config_.dataloader}")
		dataloader = dataloader_class(
			in_path = config_.in_path,
			ent_file = config_.ent_file,
			rel_file = config_.rel_file,
			train_file = config_.train_file,
			valid_file = config_.valid_file,
			test_file = config_.test_file,
			batch_size = config_.batch_size,
			neg_ent = config_.neg_ent,
			test = True,
			test_batch_size = config_.test_batch_size,
			type_constrain = config_.type_constrain,
			num_workers = config_.num_workers,
			train_sampler = import_class(f"unike.data.{config_.train_sampler}"),
			test_sampler = import_class(f"unike.data.{config_.test_sampler}")
		)

		# define the model
		model_class = import_class(f"unike.module.model.{config_.model}")
		if config_.model in ["TransE", "TransH"]:
			kge_model = model_class(
			    ent_tol = dataloader.get_ent_tol(),
			    rel_tol = dataloader.get_rel_tol(),
			    dim = config_.dim,
			    p_norm = config_.p_norm,
			    norm_flag = config_.norm_flag
			)
		elif config_.model == "TransR":
			transe = TransE(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim = config_.dim,
				p_norm = config_.p_norm,
				norm_flag = config_.norm_flag
			)
			kge_model = model_class(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim_e = config_.dim,
				dim_r = config_.dim,
				p_norm = config_.p_norm,
				norm_flag = config_.norm_flag,
				rand_init = config_.rand_init)
			model_e = NegativeSampling(
				model = transe,
				loss = MarginLoss(margin = config_.margin_e)
			)
			trainer_e = Trainer(
				model = model_e,
				data_loader = dataloader.train_dataloader(),
				epochs = 1,
				lr = config_.lr_e,
				opt_method = config_.opt_method_e,
				use_gpu = config_.use_gpu_trainer,
				device = config_.device
			)
			trainer_e.run()
			parameters = transe.get_parameters()
			transe.save_parameters("./transr_transe.json")
			kge_model.set_parameters(parameters)
		elif config_.model == "TransD":
			kge_model = model_class(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim_e = config_.dim_e,
				dim_r = config_.dim_r,
				p_norm = config_.p_norm,
				norm_flag = config_.norm_flag)
		elif config_.model == "RotatE":
			kge_model = model_class(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim = config_.dim,
				margin = config_.margin,
				epsilon = config_.epsilon)
		elif config_.model in ["RESCAL", "DistMult", "HolE", "ComplEx", "Analogy", "SimplE"]:
			kge_model = model_class(
			    ent_tol = dataloader.get_ent_tol(),
			    rel_tol = dataloader.get_rel_tol(),
			    dim = config_.dim)
		elif config_.model == "RGCN":
			kge_model = model_class(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim = config_.dim,
				num_layers = config_.num_layers)
		elif config_.model == "CompGCN":
			kge_model = model_class(
				ent_tol = dataloader.get_ent_tol(),
				rel_tol = dataloader.get_rel_tol(),
				dim = config_.dim,
				opn = config_.opn,
				fet_drop = config_.fet_drop,
				hid_drop = config_.hid_drop,
				margin = config_.margin,
				decoder_model = config_.decoder_model)

		# define the loss function
		loss_class = import_class(f"unike.module.loss.{config_.loss}")
		if config_.loss == 'MarginLoss':
			loss = loss_class(
				adv_temperature = config_.adv_temperature,
				margin = config_.margin
			)
		elif config_.loss in ['SigmoidLoss', 'SoftplusLoss']:
			loss = loss_class(adv_temperature = config_.adv_temperature)
		elif config_.loss == 'RGCNLoss':
			loss = loss_class(
				model = kge_model,
				regularization = config_.regularization
			)
		elif config_.loss == 'CompGCNLoss':
			loss = loss_class(model = kge_model)
		
		# define the strategy
		strategy_class = import_class(f"unike.module.strategy.{config_.strategy}")
		if config_.strategy == 'NegativeSampling':
			model = strategy_class(
				model = kge_model,
				loss = loss,
				regul_rate = config_.regul_rate,
				l3_regul_rate = config_.l3_regul_rate
			)
		elif config_.strategy == 'RGCNSampling':
			model = strategy_class(
				model = kge_model,
				loss = loss
			)
		elif config_.strategy == 'CompGCNSampling':
			model = strategy_class(
				model = kge_model,
				loss = loss,
				smoothing = config_.smoothing,
				ent_tol = dataloader.train_sampler.ent_tol
			)

		# test the model
		tester_class: type[Tester] = import_class(f"unike.config.{config_.tester}")
		tester = tester_class(
			model = kge_model,
			data_loader = dataloader,
			prediction = config_.prediction,
			use_tqdm = config_.use_tqdm,
			use_gpu = config_.use_gpu_tester,
			device = config_.device_tester
		)
  
		wandb_logger = WandbLogger(endpoint='wandb')
		wandb_logger.logger = wandb

		# # train the model
		trainer_class: type[Trainer] = import_class(f"unike.config.{config_.trainer}")
		trainer = trainer_class(
			model = model,
			data_loader = dataloader.train_dataloader(),
			epochs = config_.epochs,
			lr = config_.lr,
			opt_method = config_.opt_method,
			use_gpu = config_.use_gpu_trainer,
			device = config_.device_trainer,
			tester = tester,
			test = True,
			valid_interval = config_.valid_interval,
			log_interval = config_.log_interval,
			save_path = config_.save_path,
			use_early_stopping = config_.use_early_stopping,
			metric = config_.metric,
			patience = config_.patience,
			delta = config_.delta,
			wandb_logger = wandb_logger
		)
		trainer.run()
unike.config.HPOTrainer 源代码

Docs