Roadmap: Business Intelligence Analyst

Roadmap: Business Intelligence Analyst

Base de datos / Programación / Matemática

Business Intelligence es la capacidad de comprender las interrelaciones de los hechos y establecer estrategias para alcanzar una meta.

Mediante las herramientas y técnicas de ETL (extraer, transformar y cargar) se extraen datos, se depuran y limpian para cargarlos a un repositorio. La principal actividad de BI es la explotación de los datos.

Las técnicas avanzadas que se suelen aplicar son: Speachto Text, Text Mining, Big Data, Redes Neuronales, Algoritmos genéticos.

Roadmap:


Fundamentos BI

  • Inteligencia de Negocios
  • Niveles a los que opera la inteligencia de negocios
  • Data Warehouse
  • Data Mining
  • Knowledge Discovery
  • OLAP y Tableros de comando

  • Conceptos de probabilidad y estadística
  • Test de Hipótesis
  • Correlaciones
  • Regresión Lineal, Polinómica, Exponencial y Logarítmica
  • Regresión de dos variables
  • Árboles

Redes Neuronales

  • Clusters: Algoritmos. El problema de la interpretación

  • Reglas de Asociación: Algoritmos. Modelos

  • Redes Neuronales: El perceptrón. Redes de múltiples capas. Memorias fantasmas, capacidad de memoria y olvido de patrones

  • Algoritmos genéticos: El problema de la convergencia


Series

  • Series temporales: Componentes. Análisis descriptivo. Estimación de la tendencia. Estimación de la periodicidad. Desestacionalización. Clasificación y objetivos de las series temporales.

  • Método de Simulación de Montecarlo: Descripción. Cuando conviene utilizarlo. Convergencia.


Speachto Text – Text Mining

  • Conversión de voz a texto

  • Minería de textos: Extracción de entidades. Extracción de relaciones. Extracción no supervisada. Sumarización. Clusttering. Reducción de la dimensionalidad y construcción de semánticas.


Big Data

  • Sistemas batch / Offline:

i) Almacenamiento. HDFS. Flume. Sqoop.

ii) Procesamiento: Hadoop. Map Reduce. Hive. Pig.

iii) Analítica: Data analytics y Machine Learning con R.

  • Sistemas real time / Near real time:

i) HBase. Cassandra. ElasticSearch. Neo4j. Storm.

  • Sistemas mixtos:

i) Hadoop+Cassandra.

ii) Hadoop+HBase.

iii) Hadoop+Solr.

iv) Hadoop+Splout SQL.