Base de datos / Programación / Matemática
Business Intelligence es la capacidad de comprender las interrelaciones de los hechos y establecer estrategias para alcanzar una meta.
Mediante las herramientas y técnicas de ETL (extraer, transformar y cargar) se extraen datos, se depuran y limpian para cargarlos a un repositorio. La principal actividad de BI es la explotación de los datos.
Las técnicas avanzadas que se suelen aplicar son: Speachto Text, Text Mining, Big Data, Redes Neuronales, Algoritmos genéticos.
Roadmap:
Fundamentos BI
- Inteligencia de Negocios
- Niveles a los que opera la inteligencia de negocios
- Data Warehouse
- Data Mining
- Knowledge Discovery
- OLAP y Tableros de comando
- Conceptos de probabilidad y estadística
- Test de Hipótesis
- Correlaciones
- Regresión Lineal, Polinómica, Exponencial y Logarítmica
- Regresión de dos variables
- Árboles
Redes Neuronales
Clusters: Algoritmos. El problema de la interpretación
Reglas de Asociación: Algoritmos. Modelos
Redes Neuronales: El perceptrón. Redes de múltiples capas. Memorias fantasmas, capacidad de memoria y olvido de patrones
Algoritmos genéticos: El problema de la convergencia
Series
Series temporales: Componentes. Análisis descriptivo. Estimación de la tendencia. Estimación de la periodicidad. Desestacionalización. Clasificación y objetivos de las series temporales.
Método de Simulación de Montecarlo: Descripción. Cuando conviene utilizarlo. Convergencia.
Speachto Text – Text Mining
Conversión de voz a texto
Minería de textos: Extracción de entidades. Extracción de relaciones. Extracción no supervisada. Sumarización. Clusttering. Reducción de la dimensionalidad y construcción de semánticas.
Big Data
- Sistemas batch / Offline:
i) Almacenamiento. HDFS. Flume. Sqoop.
ii) Procesamiento: Hadoop. Map Reduce. Hive. Pig.
iii) Analítica: Data analytics y Machine Learning con R.
- Sistemas real time / Near real time:
i) HBase. Cassandra. ElasticSearch. Neo4j. Storm.
- Sistemas mixtos:
i) Hadoop+Cassandra.
ii) Hadoop+HBase.
iii) Hadoop+Solr.
iv) Hadoop+Splout SQL.