Red de información TI para profesionales ITMedia NetWork

Búsqueda avanzada

Publicidad

Publicidad

Noticias

Cloudera acelera su sistema de análisis de datos y machine learning con Data Science Workbench

Gracias a un entorno que facilita la exploración, visualización y modelaje de datos busca reforzar la colaboración entre científicos de datos, analistas y equipos de negocio

02 Abril 2017por Redacción

Cloudera acaba de anunciar Cloudera Data Science Workbench, una nueva herramienta de autoservicio para la gestión de data science en Cloudera Enterprise, que actualmente se encuentra en fase beta, y que ayuda a los departamentos de TI y a los científicos de datos colaboren, atrayendo a más usuarios a entornos compartidos en la nube de una forma correcta y flexible

Charles Zedlewski

Charles Zedlewski

Fruto de la adquisición el año pasado de la startup especializada en data science Sense.io, Data Science Workbench permite a los especialistas en Big Data utilizar sus lenguajes de código abierto favoritos, incluyendo R, Python y Scala; y acceder a sus bibliotecas en una plataforma empresarial segura sobre la base de Apache Spark nativo y la integración de Apache Hadoop, para acelerar los proyectos de análisis desde la exploración a la producción.

"Cloudera está decidida a mejorar la experiencia de los usuarios de data science y los equipos de ingeniería, en particular la de aquellos que quieren escalar sus análisis utilizando Spark para el procesamiento datos y el machine learning", comenta Charles Zedlewski, vicepresidente senior de Productos en Cloudera.

"La adquisición de Sense.io y su equipo nos proporcionó una sólida base sobre la que trabajar y ahora, gracias a Data Science Workbench, podemos poner ahora el autoservicio de data science escalable al alcance de nuestros clientes".

Más en concreto, entre los beneficios aportados por Data Science Workbench están el que los científicos de datos puedan utilizar R, Python o Scala con sus bibliotecas y frameworks favoritos directamente desde el navegador web; así como el acceso directo a datos en clusters seguros de Hadoop con Spark e Impala, y el poder compartir ideas con todo el equipo para una investigación reproducible y colaborativa.

Cloudera está decidida a mejorar la experiencia de los usuarios de data science y los equipos de ingeniería, en particular la de aquellos que quieren escalar sus análisis utilizando Spark para el procesamiento datos y el machine learning

Charles Zedlewski

Por otra parte, los profesionales de TI pueden dar libertad al equipo de data science para trabajar como quieran y cuando quieran, cumplir con el soporte “out-of-the-box” de seguridad completa en Hadoop, especialmente en Kerberos, y realizar el trabajo on-premise o en la nube, de modo que el usuario pueda decidir en función de dónde gestione sus datos.

A medida que el data science abierto se expande más allá de los extensos ecosistemas Python y R, para incluir marcos de aprendizaje profundo como Tensorflow, Microsoft Cognitive Toolkit, MXnet o BigDL, los equipos de ciencia de datos buscan nuevas formas de trasladar estas herramientas a sus datos almacenados en los entornos Hadoop.

“Al proporcionar fácil acceso a los datos, Data Science Workbench reduce el tiempo necesario para poner en valor aplicaciones IA desarolladas con la plataforma automatizada de machine learning de DataRobot”, explica Jeremy Achin, CEO y cofundador de DataRobot. “DataRobot está completamente integrado y ayuda a los usuarios de Cloudera a aumentar y aprovechar el valor de negocio de las mejores técnicas en algoritmos y data science gracias a su sencilla interfaz".

Cloudera Data Science Workbench ofrece un entorno seguro para combinar las últimas innovaciones en código abierto con la plataforma unificada en la que confían sus clientes

"Los equipos de TI tienen que lidiar con dificultades para que los científicos de datos se unan a entornos compartidos, ya que sus necesidades son muy diversas, especialmente cuando están involucradas herramientas de código abierto. Como resultado se producen duplicaciones, silos analíticos y limitaciones de la seguridad y el control. Mientras tanto, los científicos de datos están constantemente buscando expandir su trabajo a conjuntos de datos más grandes y plataformas de computación más potentes", explica Zedlewski.

"Con Data Science Workbench, Cloudera ayuda a los departamentos de TI y a los científicos de datos a trabajar juntos, atrayendo a más usuarios a entornos compartidos en la nube de una forma correcta y flexible". Más información en www.cloudera.com en www.cloudera.com/blog/ y en http://vision.cloudera.com

ShareThis

Publicidad

Publicidad

Destacamos

  • El Data Fabric, clave para impulsar la digitalización del sector público

    La digitalización de las organizaciones públicas es una cuestión crucial en un mundo cada vez más conectado y avanzado tecnológicamente. Para Julio Campoy, vicepresidente de Appian, una transformación esencial para facilitar y simplificar tanto los procesos internos como para los que se dirigen a los ciudadanos y en la que el Data Fabric cobra singular importancia

Envío de artículos por email de IT CIO.es

Por favor, introduzca la siguiente información











Cerrar

Envío de artículos por email de IT CIO.es

Procesando envíos...

Envío de artículos por email de IT CIO.es

Email enviado. Cerrar

Envío de artículos por email de IT CIO.es

Error en el envio. Pulse aqui para cerrar.Cerrar