PublicHolidays Класс
Представляет общедоступный набор данных для государственных праздников.
Эти наборы данных содержат данные по всему миру, полученные из пакета праздников PyPI и Википедии, охватывающие 38 стран или регионов с 1970 по 2099 год. Каждая строка указывает сведения о празднике для определенной даты, страны или региона, а также о том, заплатили ли большинство людей время отпуска. Дополнительные сведения об этом наборе данных, включая описания столбцов, различные способы доступа к набору данных и примеры , см . в каталоге открытых наборов данных Microsoft Azure Open Dataset.
Инициализация полей фильтрации.
Конструктор
PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)
Параметры
Имя | Описание |
---|---|
country_or_region
Обязательно
|
Страна или регион для возврата данных. |
start_date
|
Дата начала загрузки данных включительно. Если нет, Default value: 2008-01-01 00:00:00
|
end_date
|
Дата завершения загрузки данных включительно. Если нет, Default value: 2024-12-13 00:00:00
|
cols
|
Список имен столбцов для загрузки из набора данных. Если нет, все столбцы загружаются. Сведения о доступных столбцах в этом наборе данных см. в разделе " Общедоступные праздники". Default value: None
|
enable_telemetry
|
Включение телеметрии в этом наборе данных. Default value: True
|
country_or_region
Обязательно
|
Страна или регион, к который вы хотите запросить. |
start_date
Обязательно
|
Дата начала запроса включительно. |
end_date
Обязательно
|
Дата окончания, которую вы хотите запрашивать включительно. |
cols
Обязательно
|
Список имен столбцов, которые вы хотите получить. Ни один из них не получит все столбцы. |
enable_telemetry
Обязательно
|
Указывает, следует ли отправлять данные телеметрии. |
Комментарии
В приведенном ниже примере показано, как получить доступ к набору данных.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
Методы
filter |
Время фильтрации. |
filter
Время фильтрации.
filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)
Параметры
Имя | Описание |
---|---|
env
Обязательно
|
Среда выполнения. |
min_date
Обязательно
|
Минимальная дата. |
max_date
Обязательно
|
Максимальная дата. |
Возвращаемое значение
Тип | Описание |
---|---|
Отфильтрованный кадр данных. |
Атрибуты
country_or_region_column_name
country_or_region_column_name = 'countryOrRegion'
countrycode_column_name
countrycode_column_name = 'countryRegionCode'
default_end_date
default_end_date = datetime.datetime(2024, 12, 13, 0, 0)
default_max_end_date
default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)
default_start_date
default_start_date = datetime.datetime(2008, 1, 1, 0, 0)