Рубрикатор |
Все новости | Новости компаний |
Oracle выпустила облачную платформу Oracle Cloud Data Science Platform
20 февраля 2020 |
Корпорация Oracle объявила о доступности платформы Oracle Cloud Data Science Platform с семью новыми сервисами и Oracle Cloud Infrastructure Data Science в основе. Новые сервисы помогут предприятиям сделать проекты в области Data Science более успешными благодаря решению задач совместной разработки, обучения, управления и развертывания моделей машинного обучения.
Cервис Oracle Cloud Infrastructure Data Science помогает повысить эффективность деятельности групп специалистов по обработке и анализу данных. Для этого предлагаются такие возможности, как общие проекты, каталоги моделей, групповые политики безопасности, обеспечиваются воспроизводимость и аудит. Oracle Cloud Infrastructure Data Science автоматически выбирает наиболее оптимальные обучающие наборы данных благодаря использованию AutoML для выбора и настройки алгоритма, оценки и объяснения модели.Семь новых сервисов Oracle Cloud Data Science Platform включают в том числе новый каталог данных для обнаружения, поиска, организации, обогащения и создания активов данных; новый сервис больших данных, обеспечивающий полную реализацию Cloudera Hadoop; новый сервис, который предоставляет SQL-доступ к HDFS; новый, полностью управляемый сервис для запуска приложений Apache Spark.
Сегодня организации реализуют лишь малую часть огромного трансформирующего потенциала данных, поскольку специалисты по данным не получают простого доступа к нужным данным и не располагают инструментами для создания и развертывания эффективных моделей машинного обучения. В итоге на разработку моделей уходит слишком много времени, они не всегда соответствуют корпоративным требованиям в отношении точности и надежности и очень часто так и не запускаются в эксплуатацию.
«Эффективные модели машинного обучения являются основой успешных проектов в области науки о данных (Data Science), но объем и разнообразие данных, с которыми сталкиваются предприятия, могут помешать этим инициативам еще до того, как они начнут реализовываться, – сказал Грег Павлик, старший вице-президент Oracle по разработке продуктов обработки данных и ИИ. – С помощью Oracle Cloud Infrastructure Data Science мы повышаем продуктивность отдельных специалистов по данным, автоматизируя весь их рабочий процесс, и добавляем мощную поддержку коллективной работы. Это обеспечивает реальную ценность проектов Data Science для бизнеса».
Сервис Oracle Cloud Infrastructure Data Science включает автоматизированный процесс обработки данных, экономя время и уменьшая количество ошибок, благодаря следующим возможностям:
- AutoML, автоматический выбор алгоритмов и настройка автоматизирует процесс выполнения тестов для нескольких алгоритмов и конфигураций гиперпараметров. Система проверяет результаты на точность и подтверждает, что для использования выбраны оптимальная модель и конфигурация. Это значительно экономит время специалистов по обработке и анализу данных и, что еще более важно, позволяет каждому из них получать те же результаты, что и самые опытные специалисты.
- Автоматический выбор предиктивных признаков упрощает создание и отбор признаков, автоматически определяя ключевые предиктивные признаки по большим наборам данных.
- Оценка модели генерирует полный набор метрик оценки и соответствующих визуализаций для измерения характеристик модели с новыми данными. Она позволяет ранжировать модели с течением времени, чтобы обеспечить оптимальное поведение рабочей версии. Оценка модели выходит за рамки прямой оценки характеристик. Чтобы полностью учесть различные воздействия ошибок первого и второго рода (false positive и false negative), принимается во внимание ожидаемое базовое поведение и используется модель затрат.
- Объяснение модели: сервис Oracle Cloud Infrastructure Data Science автоматически предоставляет объяснение относительного веса и важности факторов, влияющих на формирование прогноза. Она предлагает первую коммерческую реализацию независимого от модели объяснения. Например, с помощью модели выявления мошенничества специалист по данным может объяснить, какие факторы являются основными причинами мошенничества. Это помогает компании изменить процессы или внедрить меры безопасности.
- Общие проекты помогают пользователям организовывать работу, осуществлять контроль версий и надежно делиться результатами, включая сеансы работы с данными и блокнотами.
- Каталоги моделей позволяют членам группы надежно обмениваться уже построенными моделями и артефактами, необходимыми для изменения и развертывания моделей.
- Коллективные политики безопасности дают пользователям возможность контролировать доступ к моделям, коду и данным, которые полностью интегрированы с функциями Oracle Cloud Infrastructure Identity and Access Management.
- Функциональные возможности воспроизводимости и аудита позволяют предприятию отслеживать все соответствующие активы. Все модели можно воспроизвести и проверить, даже если члены команды покидают коллектив.
- С помощью Oracle Cloud Infrastructure Data Science организации могут ускорить успешное развертывание моделей, получить для предиктивной аналитики результаты и производительность корпоративного уровня и обеспечить положительные результаты для бизнеса.
- Oracle Cloud Infrastructure Data Science: позволяет пользователям создавать, новые модели машинного обучения, обучать их и управлять ими в среде Oracle Cloud с использованием Python и других инструментов и библиотек с открытым исходным кодом, включая TensorFlow, Keras и Jupyter.
- Новые возможности машинного обучения в Oracle Autonomous Database: алгоритмы машинного обучения тесно интегрированы в автономную базу данных Oracle Autonomous Database с новой поддержкой Python и автоматизированного машинного обучения. Предстоящая интеграция с сервисом Oracle Cloud Infrastructure Data Science позволит разработчикам создавать модели, используя как открытый код, так и масштабируемые алгоритмы в самой базе данных. Уникальное применение алгоритмов к данным в Oracle Database ускоряет получение результатов за счет сокращения времени подготовки и уменьшения потребности в перемещении данных.
- Oracle Cloud Infrastructure Data Catalog: каталог данных помогает пользователям обнаруживать, находить, организовывать, обогащать и отслеживать активы данных в Oracle Cloud. Каталог Oracle Cloud Infrastructure Data Catalog имеет встроенный бизнес-глоссарий, позволяющий легко подбирать и находить нужные и доверенные данные.
- Oracle Big Data Service: предлагает полную реализацию Cloudera Hadoop с существенно более простым управлением по сравнению с другими предложениями Hadoop. Например, одним щелчком мышью можно создать кластер высокой доступности или обеспечить безопасность. Oracle Big Data Service также включает в себя машинное обучение для Spark, что позволяет организациям выполнять алгоритмы машинного обучения Spark в памяти с использованием одного продукта и с минимальным перемещением данных.
- Oracle Cloud SQL: позволяет выполнять SQL-запросы к данным в HDFS, Hive, Kafka, NoSQL и объектном хранилище. Только CloudSQL позволяет любому пользователю, приложению или аналитическому инструменту, которые могут взаимодействовать с базами данных Oracle, прозрачно работать с данными в других хранилищах данных, используя преимущества обработки со спуском (push-down) и горизонтальным масштабированием (scale-out) данных для минимизации их перемещения.
- Oracle Cloud Infrastructure Data Flow: полностью управляемый сервис больших данных, позволяющий пользователям выполнять приложения Apache Spark, не создавая инфраструктуру для их развертывания или управления ими. Это дает предприятиям возможность быстрее выпускать приложения с использованием больших данных и ИИ. В отличие от конкурирующих сервисов Hadoop и Spark, сервис Oracle Cloud Infrastructure Data Flow предлагает единое окно для отслеживания всех заданий Spark, позволяющее легко выявлять ресурсоемкие задачи или диагностировать и устранять проблемы.
- Oracle Cloud Infrastructure Virtual Machines for Data Science: виртуальные машины Oracle Cloud Infrastructure для Data Science – это предварительно сконфигурированные среды на базе графических процессоров с общими IDE, блокнотами и фреймворками, которые можно настроить и запустить менее чем за 15 минут за 30 долларов в день.
Читайте также:
Разработан инструмент инкрементальной миграции данных из СУБД Oracle в СУБД PostgreSQL
Oracle Cloud запустит облачный регион в Марокко
На производстве авиадвигателей в Рыбинске внедрят искусственный интеллект
Представлена система контроля производства цемента и бетона на основе блокчейна и машинного обучения
Лауреатами международной премии Yandex ML Prize стали 11 человек
Оставить свой комментарий:
Комментарии по материалу
Данный материал еще не комментировался.