miércoles, 15 de junio de 2016

Instalación de Oracle Data Integration - ODI

Introducción
ODI es la herramienta de Oracle para realizar procesos de ETL (Extracción Transformación y Carga) , su utilización está indicada en proyectos en los que se necesite leer información de distintas fuentes u origenes con formatos diferentes, como pueden ser diferentes tipos de Bases de datos o diferentes tipos de ficheros, de servicios web, etc. También podría utilizarse como una migración de datos que se estaban manejando con OWB (Oracle Warehouse Builder).

 Los componentes que forman la herramienta que se instalará se muestran a continuación
 (imagen obtenida de la documentación de Oracle):


El primer elemento es el ODI Studio , formado por un diseñador que permite definir los procesos a realizar con los datos así como las conexiones y toda la metadata necesaria para definir los elementos con los que se va a trabajar en cada proyecto de ETL.
El segundo elemento es el Repository (Almacen - donde se guardará tanto la información correspondiente a los objetos que vamos a manejar como conexiones, tablas, bases de datos, etc lo que se suele conocer como metada).
El tercer elemento lo componen los procesos que van a tratar la información, la responsabilidad de que se realicen los procesos es de los agentes, que son los que se encargan de que sigan las pautas con las que se han definido los procesos como la secuencia de ejecución de los procesos en el orden establecido.
Por último, en la parte inferior de la imagen se pueden ver los diferentes orígenes de datos que van a ser leídos para extraer la información que nos interesa analizar posteriormente o que se va a guardar en un DataWareHouse para su explotación mediante herramientas de Business Inteligent.

Descargar el software necesario
Instalables de ODI Descargar desde la siguiente URL:
http://www.oracle.com/technetwork/middleware/data-integrator/downloads/index.html
Los ficheros zip contienen los archivos jar que hay que descomprimir.
fmw_12.2.1.0.0_odi_Disk1_1of2.zip -> fmw_12.2.1.0.0_odi.jar fmw_12.2.1.0.0_odi_Disk1_2of2.zip -> fmw_12.2.1.0.0_odi2.jar

Instrucciones
Esta página contiene diferentes enlaces con documentación de apoyo para trabajar:
http://www.oracle.com/technetwork/middleware/data-integrator/overview/index.html


Instalación (Se requiere como mínimo el JDK 1.7)
Desempaquetar los jar con la sentencia:
java –jar [PathFicheroJar\]fmw_12.2.1.0.0_odi.jar


Configurar la instalación
Una vez descomprimidos los ficheros aparece el Instalador que le guía para que se realice la configuración de la herramienta.

Lanzar Oracle Data Integrator Studio
Finalizado el proceso arrancar Oracle Data Integrator Studio, su ubicación es:
ODI_HOME\odi\studio\odi.exe

viernes, 3 de junio de 2016

Instalación de R + R Studio en un equipo Windows

Introducción 

En esta entrada del blog veremos como instalar dos herramientas estadísticas muy utilizadas en tratamiento de información, la primera de ellas es R, y la segunda RStudio, que utiliza la primera y le añade algunas funcionalidades para hacerla más potente y manejable. Empezaremos dando las instrucciones para conseguir el software y luego indicando los pasos de la instalación. Luego se indican los mismos pasos para el caso de RStudio.

1. Conseguir el software

La instalación de R está disponible en varias localizaciones, se trata de seleccionar la que se tenga más cercana. Los 'mirrors' donde se dispone del software de instalación se pueden consultar en:
https://cran.r-project.org/mirrors.html
Puedes descargar el instalador de RStudio de la siguiente URL:

2. Instalar R

Una vez descargado el instalador, por ejemplo R-3.2.4revised-win.exe , simplemente lanzarlo y seguir las instrucciones indicando la ubicación donde se quiere crear el directorio para que se copien los ficheros del progama. Recordar anotar la ubicación exacta donde se copien los ficheros para que se configure luego en RStudio,
ejemplo [path_R] = 'd:\R-3.2.4'

3. Instalar RStudio

Una vez descargado el instalador , por ejemplo 'RStudio-0.99.893.exe', lanzar el programa para que se copien los ficheros a nuestro PC.

4. Configuración

Indicar en las opciones de configuración donde se ha instalado previamente R ([path_R]). En el Menú Tools- Global Options rellenar el apartado R versión con el [Path_R].
Otra opción a configurar es el directorio de trabajo (working directory), se trata de utilizar una carpeta en la que ir clasificando los diferentes proyectos de RStudio.

Proxy

Puede suceder que el pc se encuentre dentro de una red corporativa con lo que será necesario configurar un proxy, esto es necesario por ejemplo para poder descargar alguna librería se pueda acceder a internet para bajarla.
Hay varias formas de trabajar cuando se tiene un proxy corporativo:
1 . En la línea de comandos indicar usuario,password, proxy y puerto del proxy :
[Path_RStudio\]Rgui.exe http_proxy=http://user_id:passwod@your_proxy:your_port/

2. Establecer variables de sistema
Sys.setenv(http_proxy="http://miproxy.micia.es:nnnn") Sys.setenv(HTTPS_PROXY="http://miproxy.micia.es:nnnn") Sys.setenv("http_proxy_user"="ask") Sys.setenv("HTTPS_PROXY_USER"="ask")

Para R seria:
Sys.setenv(http_proxy = "http://http://your_proxy:your_port/", http_proxy_user ="user_id:passwod")

Para RStudio configurar la siguiente linea en el fichero 'Rprofile.site' localizado en R.x.x\etc\Rprofile.site
utils::setInternet2(TRUE)

Importar datos de un valor de la bolsa y visualizar graficamente con RStudio

Introducción

En esta entrada del Blog se explica como utilizar R para descargar datos de la web de yahoo para una empresa que cotiza en la bolsa de Madrid y para un rango de fechas determinado. Posteriormente, una vez cargada la información se puede visualizar una gráfica correspondiente a los datos por medio de la libreria 'quantmod'.

Cargar las librerías necesarias

Iniciar el programa RStudio y en primer lugar cargar las librerias necesarias.
#Instalar paquete
install.packages("quantmod")
#Cargar
library(quantmod)

Importar los datos del valor deseado

Una vez cargadas las librerias procedemos a leer los datos de yahoo, en el ejemplo se cargan valores de Telefónica y de Santander de enero del 2015 a enero del 2016.
#importar los datos
getSymbols(c('TEF.MC','SAN.MC'), src='yahoo', from = "2015-01-01", to= "2016-01-01")

Visualizar gráfica de datos

#Generar la gráfica
chartSeries(TEF.MC,theme=chartTheme('white', up.col='green4', dn.col='red'),TA=c(addVo(),addBBands(), addWPR()))