Máster Certificado en Big Data y Minería de Datos
Recomendaciones similares

Últimas novedades

curso Apache Kafka
curso Máster Certificado en Big Data y Minería de Datos
curso Minería de datos con IBM BigData e Infosphere BigInsights
curso Programación Estadística con R
curso Proceso de Flujos de Datos Masivos con Storm y Kafka
curso Visualización de Datos Complejos con D3
curso Minería de Datos y Análisis Estadístico con Apache Mahout

Mejor Valorados

curso Proceso de Flujos de Datos Masivos con Storm y Kafka
curso Programación Estadística con R
curso Minería de Datos y Análisis Estadístico con Apache Mahout
curso Apache Kafka
curso Máster Certificado en Big Data y Minería de Datos

Más visitados

curso Máster Certificado en Big Data y Minería de Datos
curso Apache Kafka
curso Programación Estadística con R
curso Minería de datos con IBM BigData e Infosphere BigInsights
curso Minería de Datos y Análisis Estadístico con Apache Mahout

Descargar catálogo de cursos

[M-380] Minería de datos con IBM BigData e Infosphere BigInsights (40 h)

Nivel: AvanzadoAvanzadoAvanzadoAvanzado

Presentación
En este curso se examina y profundiza la oferta de IBM en el ámbito de BigData , aplicada al procesamiento, minería y análisis estadístico de grandes conjuntos de información. El curso enfoca los diferentes productos desde una perspectiva dual : tanto de administración de sistemas como desarrollo. El curso igualmente prepara para la obtención de las certificaciones oficiales de IBM
Temario
PARTE 1. Introducción al ecosistema BigData de IBM
		1. La base : Hadoop
		2. InfoSphere BigInsights
		3. InfoSphere BigSheets (BigInsights Analytics)
		4. InfoSphere Streams
		5. InfoSphere DataExplorer
		6. Cognos BI
		7. BigR
		8. IBM Platform Symphony
		9. IBM Spectrum Scale (GPFS)
		10. Infosphere DataClick

PARTE 2. InfoSphere BigInsights
		1. Instalación
		2. Módulos disponibles
		3. Ediciones BigInsights
		4. Despliegue de aplicaciones
		5. Administración básica. La consola Web
		6. El sistema de archivos GPFS
		7. Comparativa GPFS vs HDFS
		8. Instalación y despliegue de Clusters BigInsights

PARTE 3. Programación para InfoSphere BigInsights
		1. Introducción al paradigma MapReduce
		2. Procesos básicos Map/Reduce
		3. API de flujos
		4. Map Reduce Adaptativo e IBM Platform Symphony

PARTE 4. PIG
		1. Leyendo y escribiendo datos con Pig
		2. Cargando datos
		3. Pig Schemas
		4. Tipos de datos
		5. Filtrando Datos
		6. Agrupando y ordenando datos
		7. Expresiones y funciones
		8. Unión de múltiples conjuntos de datos
		9. Validación de conjuntos de datos
		10. Depuración con Pig

PARTE 5. R
		1. Introducción a R
		2. Funciones escalares, vectoriales y generadoras
		3. Funciones estadísticas
		4. Estructuras de control
		5. Paquetes R
		6. Visualización de datos
		7. IBM BigR - Integración entre R y BigInsights
		8. Hadoop con R: rmrr, rhdfs, rhadoop
		9. Casos prácticos con R


PARTE 6. Flujos de proceso en BigInsights 
		1. Importación desde fuentes relacionales : Sqoop
		2. Carga de datos relacionales en Hive
		3. Importación desde fuentes textuales : Flume
		4. Introducción a Oozie
		5. Planificación de Trabajos
		6. Gestión de la ejecución

PARTE 7. BigSQL 3.0
		1. Introducción
		2. Importación de datos
		3. Tipos de datos complejos
		4. Acceso rápido a datos HDFS de HCatalog
		5. Construyendo queries
		6. Procedimientos Almacenados
		7. Monitorización
		8. Optimizando Joins
		9. Buenas prácticas
		10. Analítica de texto con BigInsight

PARTE 8. BigInsight Analytics
		1. Introducción a BigSheets
		2. Acceso a datos
		3. Manejo de Workbooks
		4. Integración con BigSQL
		5. Visualización de datos
		6. Programación en Analytics
		7. Annotation Query Language
		8. Validación de datos con AQL
		9. JAQL

PARTE 9. InfoSphere Streams
		1. Introducción
		2. Casos de uso
		3. Gestión de Instancias InfoSphere
		4. Gestión de Trabajos
		5. Rendimiento y Optimización

PARTE 10. Programación sobre InfoSphere Streams    
		1. Lenguaje SPL (Stream Processing Language)
		2. Objetos Adaptadores
		3. Operadores Relacionales
		4. Joins y ventanas de datos
		5. Agregación y Ordenación
		6. Coordinación de tareas y temporización
		7. Listas, Mapas y Conjuntos
		8. Depuración
		9. Toolkits
		10. Integración con BBDD
		11. Integración con WebSphere MQ
		12. Instalación de plugins Eclipse
		13. Caso práctico: CEP

PARTE 11. InfoSphere DataExplorer
		1. Introducción
		2. Data discovery
		3. Caso práctico: unión de diversas fuentes para una vista única (360º)
		4. Visualización de datos mediante Dashboards




Todos los temarios de nuestros cursos se pueden personalizar a la medida de las necesidades de la empresa

Requisitos Previos
Este curso tiene como requisitos previos:
Salidas Profesionales
Materiales
A todos los alumnos se les entrega: ? Un DVD con documentación, materiales adicionales, ejemplos y con el software utilizado durante el curso, así como herramientas adicionales
Modalidades y Horarios

Modalidad Presencial

Horarios:
Mañanas (9:00-14:00)
Tardes (15:00-19:00)

Duración: 40 horas
Número mínimo de alumnos: 3
Número máximo de alumnos: 25

Modalidad de Aula Virtual

(En esta modalidad, el alumno puede participar a distancia en un curso presencial, pudiendo ver y escurchar al docente, interactuar con él y los demás asistentes, formular preguntas, etc. En definitiva, dispone de todas las ventajas de un curso presencial sin necesidad de desplazarse )

Duración: 40 horas
Número mínimo de alumnos: 5
Número máximo de alumnos: 15
Certificaciones
Este curso prepara para las siguientes certificaciones oficiales de IBM:
Información Adicional


Logo Fundación Tripartita Para empresas y empleados, podemos gestinar las bonificaciones de la Fundación Tripartita para este curso. Dependiendo de sus circunstnacias, es posible que su empresa se pueda beneficiar de una bonificación de hasta el 100% del importe del curso, resultando en un curso de coste 0.


Solicitar información adicional


(c) 2024 Planetalia S.L. Todos los derechos reservados.
Este sitio web utiiza cookies tanto propios como de terceros. El uso del sitio implica la aceptación de dicho uso, así como de los Términos y Condiciones del sitio.