Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Повысьте точность ваших моделей машинного обучения с помощью общедоступных наборов данных. Чтобы сэкономить время на обнаружении и подготовке данных, используйте проверенные наборы данных, готовые к проектам машинного обучения.
сторонними
Набор данных | Description |
---|---|
TartanAir: набор данных моделирования AirSim | Данные автономных транспортных средств AirSim, созданные для одновременной локализации и построения карты (SLAM). |
Комиссия по такси и лимузинам Нью-Йорка — желтые записи о поездках на такси | Записи поездок в такси, отмеченные желтым, включают такие данные, как время или дата посадки и высадки пассажиров, пункты посадки и высадки, расстояние поездки, детализированные пассажирские тарифы, виды тарифа, виды оплаты и отчет водителя о количестве пассажиров. |
Комиссия по такси и лимузинам Нью-Йорка — зеленые записи о поездках на такси | Записи поездок в такси, отмеченные зеленым, включают такие данные, как время или дата посадки и высадки пассажиров, пункты посадки и высадки, расстояние поездки, детализированные пассажирские тарифы, виды тарифа, виды оплаты и отчет водителя о количестве пассажиров. |
Комиссия по такси и лимузинам Нью-Йорка — записи о поездках на прокатном транспорте (служба FHV) | Записи о поездках на прокатном транспорте, которые содержат поля с номером лицензии в диспетчерском центре, дату и время посадки пассажиров, а также идентификатор местоположения такси. |
Здравоохранение и геномика
Набор данных | Description |
---|---|
Озеро данных COVID-19 | COVID-19 Data Lake — это коллекция наборов данных о COVID-19, полученных из разных источников. Это данные системы отслеживания результатов тестирования и лечения, а также сведения о соблюдении правил социального дистанцирования, вместимости больниц, перемещениях и т. д. |
Труд и экономика
Набор данных | Description |
---|---|
US Labor Force Statistics (Статистика по занятому населению США) | Статистика труда США предоставляет статистику труда, показатели участия в рабочей силе и гражданское неинституциональное население по возрасту, полу, расе и этническим группам в США. |
US National Employment Hours and Earnings (Время занятости и заработная плата граждан США) | Программа статистики текущей занятости (CES) предоставляет подробную оценку отрасли в плане занятости несельскохозяйственного персонала, рабочем времени и окладах в Соединенных Штатах. |
US State Employment Hours and Earnings (Время занятости и заработная плата в штатах США) | Программа статистики текущей занятости (CES) предоставляет подробную оценку отрасли в плане занятости несельскохозяйственного персонала, рабочем времени и окладах в Соединенных Штатах. |
US Local Area Unemployment Statistics (Статистика безработицы в США по географическим областям) | Наборы данных US Local Area Unemployment Statistics предоставляют данные о трудоустройстве, безработице и занятости населения по регионам, округам, штатам, крупным городам с пригородами и многим городам США за месяц и за год. |
Индекс потребительских цен США | Индекс потребительских цен (CPI) измеряет среднее изменение со временем в ценах, выплачиваемых городскими потребителями для рыночной корзины потребительских товаров и услуг. |
Индекс цен производителей США: промышленность | Индекс цен производителя (PPI) измеряет среднее изменение со временем в ценах на продажу, полученных внутренними производителями для их производства. |
Индекс цен производителей США: товары | Индекс цен производителя (PPI) измеряет среднее изменение со временем в ценах на продажу, полученных внутренними производителями для их товаров. |
Население и безопасность
Набор данных | Description |
---|---|
Население США по странам | Население США по полу и расе для каждого округа США, полученного от 2000 и 2010 декабря переписи населения США. Источник данных — Бюро переписи населения США. |
Данные о населении США по почтовому индексу | Население США по полу и расе для каждого ПОЧТОВОго индекса США, полученного от декабря 2010 года. Источник данных — Бюро переписи населения США. |
Данные о безопасности Бостона | Данные для чтения о вызовах 311 в Бостоне. Этот набор данных хранится в формате Parquet и получает ежедневные обновления. |
Данные безопасности Чикаго | Данные для чтения о вызовах 311 в Чикаго. Этот набор данных хранится в формате Parquet и получает ежедневные обновления. |
Данные о безопасности в Нью-Йорке | Этот набор данных содержит все запросы в службу 311 города Нью-Йорка с 2010 г. до текущего момента. Этот набор данных хранится в формате Parquet и получает ежедневные обновления. |
Данные о безопасности Сан-Франциско | Вызовы пожарной службы и обращения в службу 311 в Сан-Франциско. Этот набор данных содержит архивные записи, собранные с 2015 года по сегодняшний день. |
Данные о безопасности Сиэтла | Отправка по вызовам 911 в управлении пожарной охраны Сиэтла. Этот набор данных обновляется ежедневно и содержит архивные записи, собранные с 2010 года по сегодняшний день. |
Дополнительные и общие наборы данных
Набор данных | Description |
---|---|
Диабет | Набор данных Diabetes (Диабет) содержит 442 образца с 10 признаками. Он идеально подходит для начала работы с алгоритмами машинного обучения. |
Имитированные данные о продажах OJ | Этот набор данных является производным от набора данных OJ Dominick и включает дополнительные имитированные данные с целью предоставления набора данных, который упрощает одновременное обучение тысяч моделей на Машинное обучение Azure. |
База данных MNIST с рукописными цифрами | База данных образцов рукописного написания цифр MNIST содержит 60 000 образцов наборов данных для обучения и тестовый набор из 10 000 образцов. Цифры нормализованы размером и центрируются на изображении фиксированного размера. |
Набор данных рекомендаций новостей от Майкрософт | MIcrosoft News Dataset (MIND) — это крупномасштабный набор данных для исследования рекомендаций новостей. Он служит эталонным набором данных для рекомендаций по новостям и содействует исследованиям в сфере рекомендаций новостей и систем рекомендаций. |
Государственные праздники | Данные о государственных праздниках 38 стран или регионов с 1970 по 2099 гг. из Википедии и пакета данных PyPI. |
Открытый набор данных по преобразованию речи в текст для русского языка | Russian Open STT — это крупномасштабный открытый набор данных преобразования речи в текст для русского языка. |