Поделиться через


NycTlcGreen Класс

Представляет открытый набор данных о поездке в такси Нью-Йорка и Лимузинской комиссии.

Зеленые записи о поездке на такси включают поля, захватывающие даты и время сбора и падения, места сбора и падения, расстояния поездки, элементы тарифы, типы ставок, типы платежей и количество пассажиров, сообщаемых водителем. Дополнительные сведения об этом наборе данных, включая описания столбцов, различные способы доступа к набору данных и примеры, см. в статье NYC Taxi & Limousine Commission — зеленые записи о поездках на такси в каталоге Open Datasets Microsoft Azure.

Пример использования класса NycTlcGreen см. в руководстве по прогнозированию тарифов на такси с помощью автоматизированного машинного обучения.

Инициализация полей фильтрации.

Конструктор

NycTlcGreen(start_date: datetime = datetime.datetime(2015, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, limit: int | None = -1, enable_telemetry: bool = True)

Параметры

Имя Описание
start_date

Дата начала загрузки данных включительно. Если нет, default_start_date используется.

Default value: 2015-01-01 00:00:00
end_date

Дата завершения загрузки данных включительно. Если нет, default_end_date используется.

Default value: 2024-12-13 00:00:00
cols

Список имен столбцов для загрузки из набора данных. Если нет, все столбцы загружаются. Сведения о доступных столбцах в этом наборе данных см. в NYC Taxi и Лимузин Комиссии - зеленые записи поездки на такси.

Default value: None
limit
int

Значение, указывающее количество дней загрузки данных to_pandas_dataframe(). Если значение не указано, значение по умолчанию -1 означает отсутствие ограничений в днях загрузки.

Default value: -1
enable_telemetry

Включение телеметрии в этом наборе данных.

Default value: True
start_date
Обязательно

Дата начала запроса включительно.

end_date
Обязательно

Дата окончания, которую вы хотите запрашивать включительно.

cols
Обязательно

Список имен столбцов, которые вы хотите получить. Ни один из них не получит все столбцы.

limit
Обязательно
int

to_pandas_dataframe() загружает только "ограничение" месяцев данных. -1 означает, что ограничение не ограничено.

enable_telemetry
Обязательно

Указывает, следует ли отправлять данные телеметрии.

Комментарии

В приведенном ниже примере показано, как получить доступ к набору данных.


   from azureml.opendatasets import NycTlcGreen
   from dateutil import parser

   end_date = parser.parse('2018-06-06')
   start_date = parser.parse('2018-05-01')
   nyc_tlc = NycTlcGreen(start_date=start_date, end_date=end_date)
   nyc_tlc_df = nyc_tlc.to_pandas_dataframe()