Mientras me sigo planteando distintas posibles opciones para mi futuro a corto/medio plazo y pensando en enfocarme profesionalmente al trabajo con datos he visto un máster (propio) modular de la UNED al que no le veo mala pinta.
Big Data y Data Science aplicados a la economía y a la administración y dirección de empresas.
No sé si habrá gente que lo conozca y me podrá dar una opinión.
Si no agradecería que quien entienda del tema me comentara cómo lo ve, teniendo en cuenta que va enfocado a gente de economía y ADE (no tanto a ingenieros/matemáticos).
Lo malo es que sea título propio y no sé cómo afecta eso a su validez o reconocimiento por parte de las empresas. La parte buena es que al ser modular se divide en tres partes y no hace falta hacerlas todas (para obtener el título de master hay que hacerlo completo, de enero a diciembre) además de que es online y eso siempre da más flexibilidad.
15 créditos ECTS (del 1 de enero al 31 de marzo de 2020) compuestos por los siguientes módulos:
MÓDULO 1: Data Science y Big Data. La Nueva Realidad (Créditos: 5)
- Introducción
- Contextualización del Tema. Conceptos Claves
2.1. Contextualización
2.2. Conceptos Claves - Minería de Datos o Data Mining
3.1. Modelos SEMMA Y CRISP-DM
3.2. Principales Métodos y Algoritmos en la Minería de Datos - Big Data
4.1. Desafíos
4.2. Aplicaciones
4.3. Principales Herramientas (Hadoop y Spark) - Programas de Software más Utilizados
5.1. R y RStudio
5.2. Weka
5.3. Introducción al lenguaje de programación Python
5.4. El programa IBM SPSS Statistics: Conexión con R y Python
5.5. Otro software: SQL, Julia, Scala
MÓDULO 2: Herramientas Big data (Créditos: 5)
- Introducción a Linux
1.1. Comandos básicos
1.2. Introducción a cómo programar en la shell
1.3. Cómo usar Linux para manipular y analizar ficheros de gran tamaño - El BigData en el Contexto del Machine Learning a Gran Escala
- Limitaciones Teóricas de las Bases de Datos Relacionales
- Escalado Vertical vs. Escalado Horizontal
- Estrategias de computación distribuida y en paralelo
- Arquitectura de la Solución Machine Learning para BigData
6.1. Capa de Ingesta de Datos
6.2. Capa de Ingestión
6.3. Capa de Almacenamiento (Hadoop Storage)
6.4. Plataforma Hadoop – Capa de Procesamiento
6.5. Capa Analítica
6.6. La Capa de Consumo
6.7. La Capa de Seguridad y Monitorización - Hadoop 2.x
7.1. Componentes del Ecosistema Hadoop
7.2. Distribuciones Hadoop y Proveedores - Soluciones y Librerías Machine Learning
- Herramientas Machine Learning una Visión General
9.1. Apache Mahout
9.2. Julia
9.3. Python
9.4. Apache Spark
9.5. H2O - Paquetes Avanzados de R
- Nociones Básicas Sobre Legislación en materia de protección de datos Personales
11.1. Ámbito de Aplicación
11.2. Conceptos Básicos
11.3. Principios
11.4. Derechos de las Personas
11.5. Obligaciones del Responsable del Tratamiento - Nociones Básicas Sobre Legislación en materia de protección de datos Personales
12.1. Ámbito de Aplicación
12.2. Conceptos Básicos
12.3. Principios
12.4. Derechos de las Personas
12.5. Obligaciones del Responsable del Tratamiento
MÓDULO 3: Análisis de Datos Multivariantes I (Créditos: 5)
- Modelo Lineal General
1.1. Modelo de Regresión Lineal
1.2. Extensiones al modelo de Regresión Lineal
1.3. Modelos con variables cualitativas explicativas
1.4. Modelos ANCOVA
1.5. Modelos con variable dependiente multivariante: MANOVA y MANCOVA
1.6. Estimación por máxima verosimilitud restringida (REML) en modelos mixtos
1.7. Ajuste de modelos mixtos con R - Modelo Lineal Generalizado
2.1. Formulación general.
2.2. Modelos con variables cualitativas endógenas
2.3. Modelo Tobit - Evaluación de modelos
3.1. Devianza. Estadístico G2 de Wilks de razón de verosimilitudes
3.2. Estadístico χ2 de Pearson
3.3. Criterio de información de Akaike (AIC) y Criterio de Información Bayesiano (BIC)
3.4. Prueba de Hosmer-Lemeshaw
3.5. Medidas tipo R2 - Otros modelos de regresión
4.1. Estimación Curvilínea
4.2. Regresión Ridge
4.3. Regresión Robusta
4.4. Regresión Bayesiana
4.5. Regresión no paramétrica: Splines
4.6. Modelo Aditivo Generalizado - Casos prácticos
15 créditos (adicionales) ECTS (del 1 de abril al 30 de junio de 2020) con los módulos 4 y 5 obligatorios y otro a elegir:
MÓDULO 4: Análisis de Datos Multivariantes II (Créditos: 5)
- Medidas de distancia/proximidad
1.1. Medidas de distancia o disimilaridad
1.2. Medidas de proximidad o similaridad
1.3. Distancia de Mahalanobis - Reducción de dimensiones
2.1. Análisis Factorial y Componentes Principales
2.2. Análisis de Correspondencias - Agrupamiento de la información
3.1. Análisis discriminante
3.2. Análisis cluster - Análisis de correlación canónica
- Casos prácticos
MÓDULO 5: Minería de Datos I (Créditos: 5)
- Introducción a la Minería de Datos
- Evaluación de modelos
2.1. Muestras de entrenamiento, validación y test
2.2. Validación cruzada
2.3. Métodos basados en métricas
2.4. Métodos basados en curvas ROC
2.5. Métodos que incorporan una matriz de costes
2.6. Evaluación de algoritmos - Combinación de Modelos. Métodos de Ensemble. Multiclasificadores
3.1. BAGGING
3.2. BOOSTING
3.3. DECORATE
3.4. Fusión de clasificadores
3.5. Métodos híbridos - Árboles de Decisión y Clasificación
4.1. Introducción
4.2. Aplicabilidad de los árboles de decisión para clasificación
4.3. Características de los algoritmos de clasificación
4.4. Árbol CHAID (CHi-square Automatic Interaction Detection) y CHAID exhaustivo
4.5. Árbol CRT (Classification and Regression Trees)
4.6. Árbol QUEST (Quick, Unbiased, Efficient Statistical Tree)
4.7. Árbol C5.0
4.8. Random Forest
4.9. Otros algoritmos de clasificación - Reglas de asociación
5.1. El algoritmo a priori
5.2. Validación de la regla - Redes neuronales artificiales
6.1. Introducción
6.2. Tipos de modelos de redes neuronales
6.3. Unidades de procesamiento de la información
6.4. Propiedades de los sistemas neuronales
6.5. Perceptrón multicapa
6.6. Funciones de base radial
6.7. Comparación entre las Funciones de Base Radial y el Perceptrón Multicapa
6.8. Análisis de sensibilidad e interpretación de los pesos de la red
6.9. Redes neuronales y modelos estadísticos clásicos
6.10. Otras arquitecturas de redes neuronales - Máquinas de vectores soporte
7.1. Introducción
7.2. Máquinas de Vectores Soporte con margen máximo
7.3. Máquinas de vectores soporte con margen blando y norma 1 de las variables de holgura
7.4. Máquinas de vector soporte con margen máximo en el espacio de las características. Máquinas no lineales de vectores soporte
7.5. Funciones kernel
7.6. Aplicaciones de las SVM - Métodos basados en Vecindad. K Vecinos
- Casos Prácticos
Hay que elegir otro módulo entre los restantes así que pongo este:
MÓDULO 6: Análisis de Series Temporales (Créditos: 5)
- Introducción
- Métodos de suavizado
- Descomposición temporal
- Métodos de Predicción
4.1. Métodos paramétricos: modelos ARIMA
4.2. Métodos no paramétricos: splines, aproximación por series de Fourier, función núclreo… - Clasificación y ordenación
5.1. Cluster jerárquico
5.2. Otros algoritmos - Casos prácticos
30 créditos (adicionales) ECTS (del 1 de julio al 31 de diciembre de 2020) con el trabajo final obligatorio (módulo 16) y otros 4 módulos a elegir, los pongo todos:
MÓDULO 7: Big Data en el Sector de Seguros (Créditos: 5)
- Relevancia de los datos en el negocio asegurador:
1.1. Fundamentos técnicos del negocio asegurador
1.2. Tarificación en seguros de Vida y no Vida - Tendencias data-centric disruptivas en la industria aseguradora:
2.1. Tipologías de análisis de datos y Machine Learning
2.2. Innovación basada en datos
2.3. Internet of Things (IoT)
2.4. Artificial Intelligence (AI) - Casos reales de aplicación de analítica avanzada en aseguradoras:
3.1. Irrupción del IoT
3.2. Suscripción cognitiva
3.4. InsurTechs y nuevos modelos de negocio - Pricing en seguros (práctica con R y H2O):
4.1. Modelos de supervivencia
4.2. GLM en tarificación no Vida
MÓDULO 8: Minería de Datos II (Créditos: 5)
- Introducción a los Métodos Bayesianos
- Teorema de Bayes e hipótesis MAP
- Clasificador Naïve Bayes
- Redes bayesianas
4.1. Definición formal
4.2. Independencia condicional
4.3. Inferencia o propagación del conocimiento en la Red Bayesiana
4.4. Aprendizaje en las Redes Bayesianas
4.5. Métricas de evaluación
4.6. Algoritmos de búsqueda y aprendizaje
4.7. Algoritmos basados en test de independencia
4.8. Clasificadores basados en Redes Bayesianas
4.9. Tipos de Redes Bayesianas
4.10. Ejemplo de Redes Bayesianas con WEKA - Algoritmos evolutivos
5.1. Introducción
5.2. Condiciones para la aplicación de los Algoritmos Genéticos
5.3. Ventajas e inconvenientes
5.4. Fundamentos teóricos (conceptos)
5.5. Selección de atributos con Algoritmos Genéticos
5.6. Conclusiones
5.7. Selección de variables a través de algoritmos genéticos con WEKA - Lógica Difusa
6.1. Historia
6.2. Aplicaciones
6.3. Definición y principales conceptos
6.4. Características
6.5. Etapas
6.6. Conjuntos difusos
6.7. Variables lingüísticas
6.8. Función de pertenencia o membresía
6.9. Operaciones en sets difusos
6.10. Complementos difusos, t-normas y t-conormas
6.11. Inferencia usando lógica difusa
6.12. Modelos (mecanismos) de inferencia difusa
6.13. Modelamiento difuso
6.14. Modelamiento difuso con R - Métodos de Gradient Boosting
7.1. Introducción
7.2. Metodología
7.3. Diseño de un Gradient Boosting Machine
7.4. Regularización del modelo
7.5. Influencia de las variables
7.6. Librerías de R para los modelos de GBM - Deep Learning
8.1. Introducción
8.2. Revisión de Redes Neuronales
8.3. Redes Neuronales Convolucionales
8.4. Autoencoders
8.5. Redes Neuronales recurrentes
8.6. Modelos de secuencias
MÓDULO 9: Text Mining y Web Mining (Créditos: 5)
- Definición de conceptos: Text Mining y Web Mining
1.1. Minería de Textos/Text Mining
1.2. Minería de la Web/Web Mining - Presentación de documentos: Fundamentos
2.1. Modelos vectoriales
2.2. Recuperación de información
2.3. Clasificación de documentos
2.4. Clustering de documentos
2.5. Web Content, Structure y Usage Mining - Representación de documentos: Antecedentes y estado de la cuestión
3.1. Modelo de espacio vectorial
3.2. Funciones de pesado
3.3. Representaciones distribuídas (word embeddings)
3.4. Funciones de ranking - Análisis lingüístico
4.1. Análisis léxico
4.2. Eliminanción de stop-words
4.3. Lematización y truncado (stemming)
4.4. Etiquetado gramatical (Part-of-Speech tagging)
4.5. Análisis sintáctico superficial (Shallow parsing) - Análisis de sentimientos
5.1. Enfoques basados en lexicones
5.2. Enfoques basados en Aprendizaje Automático
MÓDULO 10: La Transformación Digital en el Sector Financiero (Créditos: 5)
- Las nuevas tecnologías aplicadas al sector financiero
1.1. Big Data como paradigma de los datos en la banca y el sector financiero: Empresas data-driven
1.2. Cloud Computing
1.3. Ominicanalidad
1.4. Medios de pago
1.5. Nuevos modelos de negocio digitales en el sector bancario - La Banca Digital
2.1. Fundamentos de la Banca Digital
2.2. Creación de una cultura digital
2.3. Retos de la Banca Digital - Impacto de las Fintech en el sector financiero
3.1. Innovación y transformación de la cultura empresarial en el mundo digital
3.2. Ecosistema Fintech. Actores e implicaciones para el sector financiero
3.3. Las startups fintech
3.4. Casos de éxito y fracaso - Crowdfunding y Crowdlending
4.1. La financiación en la empresa. Oportunidades en el contexto de la economía colaborativa
4.2. Crowdfunding
4.3. Equity crowdfunding
4.4. Crowdlending
4.5. Aspectos regulatorios - Aplicaciones de Big Data y Data Science en servicios financieros
5.1. Credit Scoring
5.2. Detección del fraude
5.3. Experiencia del cliente
MÓDULO 11: Turismo y Smart Cities (Créditos: 5)
- Introducción
- Turismo y Smart Cities (I)
2.1. Definiciones
2.2. ¿Cómo se relacionan Turismo, Smart Cities, Movilidad Y Consumo?
2.3. ¿Cómo describimos el comportamiento?
2.4. Familiaricémonos con las variables. Algunos datos sobre el Turismo y las Smart Cities
2.5. Datos Smart Cities - Turismo y Smart Cities (II)
3.1. El comportamiento turístico
3.2. El gasto del turismo de No Residentes. EGATUR
3.3. El tratamiento convencional del gasto turístico. EGATUR
3.4. Algunas preguntas sobre el gasto turístico. Discusión de líneas de investigación basadas en patrones situacionales. - Turismo y Smart Cities (III)
4.1. La promoción y la regulación del Turismo. El enfoque de las Smart Cities
4.2. Datos a tener en cuenta. Flujos de personas y flujos monetarios. Patrones de comportamiento e impacto. Elementos para un mapa de coyuntura turística
4.3. Un modelo de diferencias de potencial y un modelo reproductivo, aplicados a los flujos turísticos
4.4. Algunas preguntas sobre la promoción y la regulación del turismo. Discusión de líneas de investigación - Turismo y Smart Cities (IV)
5.1. APP móviles de consumo turístico
5.2. Algunas preguntas sobre APP turísticas
5.3. Ensayo de diseño de una APP orientada a la producción masiva de datos turísticos
5.4. Una matriz de situación de una red de Smart Cities en el mercado turístico. Líneas de actuación inteligente con datos
MÓDULO 12: La Revolución del Big Data en el Transporte (Créditos: 5)
- La Importancia del Transporte en Nuestra Sociedad
1.1. Transporte y desarrollo: el concepto de accesibilidad
1.2. El Papel del Transporte en la Distribución Espacial de Actividades
1.3. Impactos del Transporte en la Sociedad y el Medio Ambiente
1.4. Los Grandes Retos del Transporte - La Revolución de los Datos: Impacto en el Sistema de Transporte
2.1. Los Medios Tradicionales de Obtención de Datos de Movilidad: Encuestas y Estadísticas
2.2. Las Nuevas Fuentes de Datos
2.3. Retos y Oportunidades de las Nuevas Fuentes de Datos - Modelos Predictivos de Planificación del Transporte
3.1. Modelos de Transporte
3.2. Modelos LUTI
3.3. Aportaciones de los Sistemas de Información Geográfica
3.4. Recursos en R - El Impacto del Big Data en la Movilidad Urbana e Interurbana
4.1. Nuevos Modelos de Negocio
4.2. Cambios en el Comportamiento de los Ciudadanos
4.3. Hacia una Mejor Planificación de lo Público - Oportunidades para el Sector Logístico
5.1. Detección de Fraude
5.2. Cooperación para la Intermodalidad del Transporte de Mercancías
MÓDULO 13: Publicidad Digital Aplicada a los Negocios (Créditos: 5)
- La Comunicación Digital
1.1. Internet y la Empresa
1.2. La Web del Usuario como Fuente de Datos en Marketing
1.3. Diferenciación y Posicionamiento en la Web
1.4. Casos Prácticos - Marketing Directo
2.1. Introducción
2.2. Nuevas Herramientas
2.3. Marketing de Relaciones
2.4. Casos Prácticos - Marketing Y Las Nuevas Tecnologías
3.1. Marketing Móvil
3.2. Marketing Integrado
3.3. Experiencia de Usuario
3.4. Casos Prácticos - Plan De Marketing
4.1. Planificación Estratégica de Marketing
4.2. Caso Práctico
MÓDULO 14: Sector Público y Sanidad (Créditos: 5)
- Aplicaciones del Big Data en la Estadística Oficial
1.1. Introducción: De la estadística 1.0 a la estadística 4.0
1.2. Big Data y su aportación a la estadística oficial mediante el estudio de la huella digital de la actividad humana
1.3. El Big data en el contexto del sistema estadístico internacional
1.4. El Big data en el contexto del sistema estadístico nacional
1.5. Big Data y estadística oficial: Retos que plantea
1.6. Algunos ejemplos de uso - Big Data en Ciencias de la Salud
2.1. Utilidades y retos del Big Data en la práctica clínica
2.2. Fuentes de datos en aplicaciones clínicas
2.3. Procesado de datos clínicos. Etapas y métricas de rendimiento diagnóstico
2.4. Análisis de casos de uso - Herramientas de Big Data aplicadas a la medicina
3.1. Ayuda al diagnóstico mediante redes neuronales
3.2. Combinación de expertos mediante ensemble learning
3.3. Deep learning en aplicaciones clínicas
3.4. Análisis de casos de uso
MÓDULO 15: Normativa de Protección de Datos (Créditos: 5)
- Introducción
1.1. Objeto
1.2. Ámbito de aplicación
1.3. Definiciones - Principios relativos
2.1. Licitud del tratamiento
2.2. Consentimiento
2.3. Otros tratamientos - Derechos del interesado
3.1. Transparencia
3.2. Información y acceso a los datos personales
3.3. Rectificación y supresión
3.4. Limitación al tratamiento
3.5. Portabilidad
3.6. Oposición y decisiones individuales automatizadas - Responsable y encargado del tratamiento
4.1. Responsabilidad del responsable del tratamiento
4.2. Encargado del tratamiento
4.3. Registro de las actividades de tratamiento
4.4. Transferencias internacionales
4.5. Cooperación con la autoridad de control - Responsabilidad proactiva
5.1. Protección de datos desde el diseño y por defecto
5.2. Delegado de protección de datos
5.3. Códigos de conducta y certificación
5.4. Análisis de riesgos y evaluaciones de impacto
5.5. Seguridad
MÓDULO 16: TRABAJO FIN DE MASTER (Créditos: 10)
Aquellos estudiantes que cursen el Máster y hayan alcanzado 50 créditos, los últimos 10 créditos para la consecución del título se obtendrán con la elaboración de un trabajo final obligatorio.
Si conocéis algún otro máster o curso (o bootcamp) relacionado con los datos que mereza la pena (porque se aprenda y por estar reconocido por las empresas) decídmelo por favor.
Gracias!