Source code for syne_tune.optimizer.schedulers.searchers.last_value_multi_fidelity_searcher

import sys
import logging
from collections import defaultdict
from typing import Dict, Optional, List, Any, Union

import numpy as np
import pandas as pd

from syne_tune.config_space import Domain

from syne_tune.optimizer.schedulers.searchers.single_objective_searcher import (
    SingleObjectiveBaseSearcher,
)
from syne_tune.optimizer.schedulers.searchers.utils import make_hyperparameter_ranges
from syne_tune.util import catchtime
from syne_tune.optimizer.schedulers.searchers.searcher_factory import searcher_dict

logger = logging.getLogger(__name__)



[docs]
class LastValueMultiFidelitySearcher(SingleObjectiveBaseSearcher):
    def __init__(
        self,
        config_space: Dict,
        random_seed: Optional[int] = None,
        points_to_evaluate: Optional[List[Dict]] = None,
        num_init_random_draws: int = 5,
        update_frequency: int = 1,
        max_fit_samples: int = None,
        searcher: Optional[Union[str, SingleObjectiveBaseSearcher]] = "kde",
        searcher_kwargs: dict[str, Any] = None,
    ):
        """
        Wrapper to use a single-fidelity surrogate as a multi-fidelity method by taking the last observation of each
        trial.
        :param config_space: Configuration space for the evaluation function.
        :param random_seed: Seed for initializing random number generators.
        :param points_to_evaluate: A set of initial configurations to be evaluated before starting the optimization.
        :param num_init_random_draws: sampled at random until the number of observation exceeds this parameter.
        :param update_frequency: surrogates are only updated every `update_frequency` results, can be used to save
        scheduling time.
        :param max_fit_samples: if the number of observation exceed this parameter, then `max_fit_samples` random samples
        are used to fit the model.
        """
        super(LastValueMultiFidelitySearcher, self).__init__(
            config_space=config_space,
            points_to_evaluate=points_to_evaluate,
            random_seed=random_seed,
        )
        self.searcher_kwargs = searcher_kwargs
        self.num_init_random_draws = num_init_random_draws
        self.update_frequency = update_frequency
        self.trial_results = defaultdict(list)  # list of results for each trials
        self.trial_configs = {}
        self.hp_ranges = make_hyperparameter_ranges(config_space=config_space)
        self.surrogate_model = None
        self.index_last_result_fit = None
        self.new_candidates_sampled = False
        self.sampler = None
        self.max_fit_samples = max_fit_samples

        self.random_state = np.random.RandomState(self.random_seed)

        if searcher_kwargs is None:
            self.searcher_kwargs = dict()
        else:
            searcher_kwargs.pop(
                "points_to_evaluate"
            )  # this is handled by the SurrogateSearcher class
            self.searcher_kwargs = searcher_kwargs

        if isinstance(searcher, str):
            assert searcher in searcher_dict
            self.searcher_cls = searcher_dict.get(searcher)
        else:
            self.searcher_cls = searcher
        self.searcher = None


[docs]
    def suggest(self, **kwargs) -> Optional[Dict[str, Any]]:
        config = self._next_points_to_evaluate()

        if config is None:
            if self.should_update():
                logger.debug(f"fit model")
                with catchtime(f"fit model with {self.num_results()} observations"):
                    self.fit_model()
                self.index_last_result_fit = self.num_results()
            if self.searcher is not None:
                logger.debug(f"sample from model")
                config = self.searcher.suggest()
            else:
                logger.debug(f"sample at random")
                config = self.sample_random()
        return config



[docs]
    def should_update(self) -> bool:
        enough_observations = self.num_results() >= self.num_init_random_draws
        if enough_observations:
            if self.index_last_result_fit is None:
                return True
            else:
                new_results_seen_since_last_fit = (
                    self.num_results() - self.index_last_result_fit
                )
                return new_results_seen_since_last_fit >= self.update_frequency
        else:
            return False



[docs]
    def num_results(self) -> int:
        return len(self.trial_results)



[docs]
    def make_input_target(self):
        configs = [
            self.trial_configs[trial_id] for trial_id in self.trial_results.keys()
        ]
        # takes the last value of each fidelity for each trial
        metrics = np.array(
            [trial_values[-1] for trial_values in self.trial_results.values()]
        )
        return configs, metrics



[docs]
    def fit_model(self):
        configs, metrics = self.make_input_target()
        self.searcher = self.searcher_cls(
            config_space=self.config_space,
            # TODO BaseSearcher expects a int for random_seed, so we cannot pass a random state, we could change to pass both
            random_seed=self.random_seed + self.random_state.randint(0, sys.maxsize),
            points_to_evaluate=None,
            **self.searcher_kwargs,
        )

        for (trial_id, config, metric) in zip(
            self.trial_results.keys(), configs, metrics
        ):
            self.searcher.on_trial_complete(
                trial_id=trial_id, config=config, metric=metric
            )



[docs]
    def on_trial_complete(
        self,
        trial_id: int,
        config: Dict[str, Any],
        metric: float,
        resource_level: int = None,
    ):
        self.trial_configs[trial_id] = config
        self.trial_results[trial_id].append(metric)



[docs]
    def on_trial_result(
        self,
        trial_id: int,
        config: Dict[str, Any],
        metric: float,
        resource_level: int = None,
    ):
        self.trial_configs[trial_id] = config
        self.trial_results[trial_id].append(metric)



[docs]
    def sample_random(self) -> Dict:
        return {
            k: v.sample(random_state=self.random_state) if isinstance(v, Domain) else v
            for k, v in self.config_space.items()
        }



[docs]
    def configs_to_df(self, configs: List[Dict]) -> pd.DataFrame:
        return pd.DataFrame(configs)