Поделиться через


PublicHolidays Класс

Представляет общедоступный набор данных для государственных праздников.

Эти наборы данных содержат данные по всему миру, полученные из пакета праздников PyPI и Википедии, охватывающие 38 стран или регионов с 1970 по 2099 год. Каждая строка указывает сведения о празднике для определенной даты, страны или региона, а также о том, заплатили ли большинство людей время отпуска. Дополнительные сведения об этом наборе данных, включая описания столбцов, различные способы доступа к набору данных и примеры , см . в каталоге открытых наборов данных Microsoft Azure Open Dataset.

Инициализация полей фильтрации.

Конструктор

PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

Параметры

Имя Описание
country_or_region
Обязательно
str

Страна или регион для возврата данных.

start_date

Дата начала загрузки данных включительно. Если нет, default_start_date используется.

Default value: 2008-01-01 00:00:00
end_date

Дата завершения загрузки данных включительно. Если нет, default_end_date используется.

Default value: 2024-12-13 00:00:00
cols

Список имен столбцов для загрузки из набора данных. Если нет, все столбцы загружаются. Сведения о доступных столбцах в этом наборе данных см. в разделе " Общедоступные праздники".

Default value: None
enable_telemetry

Включение телеметрии в этом наборе данных.

Default value: True
country_or_region
Обязательно
str

Страна или регион, к который вы хотите запросить.

start_date
Обязательно

Дата начала запроса включительно.

end_date
Обязательно

Дата окончания, которую вы хотите запрашивать включительно.

cols
Обязательно

Список имен столбцов, которые вы хотите получить. Ни один из них не получит все столбцы.

enable_telemetry
Обязательно

Указывает, следует ли отправлять данные телеметрии.

Комментарии

В приведенном ниже примере показано, как получить доступ к набору данных.


   from azureml.opendatasets import PublicHolidays
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidays(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

Методы

filter

Время фильтрации.

filter

Время фильтрации.

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

Параметры

Имя Описание
env
Обязательно

Среда выполнения.

min_date
Обязательно

Минимальная дата.

max_date
Обязательно

Максимальная дата.

Возвращаемое значение

Тип Описание

Отфильтрованный кадр данных.

Атрибуты

country_or_region_column_name

country_or_region_column_name = 'countryOrRegion'

countrycode_column_name

countrycode_column_name = 'countryRegionCode'

default_end_date

default_end_date = datetime.datetime(2024, 12, 13, 0, 0)

default_max_end_date

default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2008, 1, 1, 0, 0)