Mostrando postagens com marcador Big Data Analytics. Mostrar todas as postagens
Mostrando postagens com marcador Big Data Analytics. Mostrar todas as postagens

segunda-feira, 2 de fevereiro de 2015

[Infográfico] Big Data em Números - O que você precisa saber!

Big Data é o hype do momento, acho que isso todo mundo já sabe.

Ocorre que, mais que um simples modismo, é uma oportunidade.

E que oportunidade!

Oportunidade pras empresas, que tendo acesso a um volume maior de dados, podem fazer análises mais completas e confiáveis.

Oportunidade pra profissionais qualificados, que podem aproveitar a demanda que surge com a novidade (mesmo que não seja tão novidade assim :).

E é pra dar uma idéia mais clara dessa oportunidade que resolvi trazer pra você o primeiro infográfico do Tecnologia que Interessa!, que, baseado nas previsões do Gartner, apresenta números impressionantes, que deixam claro o quanto a tecnologia associada ao fenômeno Big Data está mudando a realidade das empresas.

Confira!


Quero destacar o fato de que, ainda que lentamente, as empresas começam a investir em Big Data aqui no Brasil, e estima-se que este mercado chegue a R$ 1 bilhão até 2018 (este ano R$ 680 milhões).

Nada mal, hein ?

Outra coisa que merece atenção é o fato de que a tecnologia se aplica a qualquer segmento, seja indústria, serviços financeiros, comunicação e mídia ou governo. Observe como o investimento aumenta em ritmo acelerado a cada ano.

Note ainda que os resultados são bem claros: 2x mais chance de aumentar o desempenho financeiro, 5x mais chance de ser mais rápida que a concorrência, 3x mais chance de melhorar o planejamento.

Definitivamente, não dá pra ignorar uma tecnologia que proporciona benefícios como estes, não acha?

Conclusão

Não canso de dizer que Big Data é uma oportunidade pra você, profissional de TI, que quer (precisa?) dar um salto na carreira, saindo na frente, sendo pioneiro e abraçando com todas as forças a inovação.

E eu estou aqui pra ajudar no que puder, basta entrar em contato.

Aproveito pra divulgar a lista Big Data Brasil, que criei há alguns meses pra trocar idéias sobre o tema, e convido você a participar. Já rolaram várias discussões legais por lá!

E então, o que achou do infográfico ? Se curtiu, compartilha aí!

sexta-feira, 21 de novembro de 2014

8 fortes tendências para Big Data Analytics

Tendências Big Data Analytics

Como acontece com qualquer nova tecnologia, as soluções para Big Data Analytics começaram a apresentar sinais de amadurecimento, e isto se reflete numa oferta de mais e melhores opções para analisar os dados das empresas aliando desempenho, usabilidade e segurança.

Analiso a seguir as 8 tendências apontadas pelo CIO.

1 - Big Data Analytics na nuvem

Embora desenvolvido inicialmente para funcionar com clusters de máquinas físicas, o Hadoop evoluiu, e muitos provedores oferecem opções para processamento de dados na nuvem, a exemplo de Amazon (Redshift e Kinesis), Google (Big Query) e IBM (Bluemix).

Há alguma controvérsia sobre os custos de utilizar soluções na nuvem para processar volumes muito grandes de dados (petabytes e acima), mas acredito num ajuste do mercado para que as ofertas de soluções na nuvem sejam atrativas mesmo para cenários mais "agressivos" de análise de dados.

Quando se trata de volumes menores de dados, a nuvem é a melhor opção, pois processar 1 TB de dados pode custar a partir de 25 dólares. Nada mal hein ?

2 - Hadoop, o sistema operacional corporativo para dados

O Hadoop atualmente suporta alternativas ao Map/Reduce, e as versões mais recentes oferecem mais recursos para escalabilidade, desempenho e segurança, além de facilidades que estão tornando cada vez mais simples utilizar as ferramentas, transformando o Hadoop no S.O. para dados "de fato", o que deve se refletir numa adoção mais acelerada de agora em diante.

Integração com SQL, dados em memória, processamento de streamming, grafos e muitos outros tipos de processamentos de dados já são suportados, tornando a solução genérica o suficiente para ser útil aos mais diversos segmentos de mercado.

3 - Big Data Lakes

Comecei a ver este termo citado com mais frequência na mídia, significando que há um movimento de utilizar o Hadoop como "repositório gigante de dados", ou seja, as empresas podem simplesmente "despejar" seus dados neste repositório, e construir gradativamente os esquemas necessários para acesso aos dados disponíveis.

Por um lado, isso reduz a necessidade de todo um trabalho prévio de modelagem antes de ser possível analisar os dados. Por outro, exige mais conhecimento para construir esquemas para acesso aos dados à medida que se tornam necessários, sob demanda, num processo incremental.

4 - Mais Análises Preditivas

Com as tecnologias para Big Data, a possibilidade de analisar mais dados implica também na possibilidade de analisar mais atributos, variáveis, metadados e registros, permitindo otimizar as amostras utilizadas em análises estatísticas e aumentando a capacidade de fazer previsões a partir dos dados.

O fato de não ter restrições de poder computacional faz uma diferença muito grande, segundo especialistas, permitindo formular os problemas de maneiras diferentes e viabilizando análises que antes eram impossíveis.

5 - SQL integrado ao Hadoop

As ferramentas que permitem o suporte à linguagem SQL com Hadoop estão evoluindo muito rapidamente, como todo o ecossistema Big Data, tanto em quantidade quanto qualidade, especialmente desempenho.

Isto é importante porque representa a possibilidade de utilizar uma linguagem que o mercado já conhece, mas dentro de um novo contexto, com novas possibilidades, o que simplifica o uso das novas soluções baseadas em Hadoop, reduzindo o investimento necessário em treinamento, por exemplo.

Embora o Hive continue evoluindo, especialista apontam que alternativas desenvolvidas pela Cloudera, Pivotal, IBM e outros fornecedores oferecem melhor desempenho, facilitando a análise interativa.

6 - Mais e melhores opções NoSQL

NoSQL não é nenhuma novidade pra quem acompanha o blog. Especialistas estimam entre 15 e 20 soluções Open Source NoSQL populares, cada uma com sua especialidade.

Soluções baseadas em grafos que facilitam a análise de redes de relacionamentos, ou especializadas em tratar fluxos de dados (streamming) de sensores ou redes sociais como Twitter, estão sendo integradas ao ecossistema Hadoop.

7 - Deep Learning

A combinação de técnicas de aprendizado de máquina conhecida como Deep Learning e que se baseia em redes neurais está evoluindo, e especialistas apontam grande potencial para a solução de problemas relacionados a negócios.

Identificar relações entre dados, ou destacar aqueles mais relevantes dentre um grande volume de informações são algumas das possibilidades que a técnica oferece, sem a necessidade de modelos especializados ou instruções através de códigos e programação.

Um exemplo muito interessante envolveu a aplicação de um algoritmo de Deep Learning para examinar dados da Wikipedia, tendo como resultado o aprendizado "por conta própria" de que Califórnia e Texas são estados dos EUA.

8 - Analytics em memória

O uso de bancos de dados em memória é cada vez maior, como demonstra a popularidade de soluções como Qlikview e Tableau, pois estas soluções, se usadas da maneira correta, podem trazer muitos benefícios às empresas através do chamado Hybrid Transaction/Analytical Processing (HTAP).

Mas tem gente usando errado, especialistas advertem. Estas soluções não são a melhor opção para lidar com dados que não mudam com frequência ou que não precisam ser analisados de muitas formas diferentes em tempo real. Nesse caso, é um desperdício de dinheiro.

O Spark é uma solução muito promissora que fornece a possibilidade de manipular grandes volumes de dados usando técnicas de armazenamento em memória de maneira análoga ao que o Map/Reduce faz em disco, e assim oferecendo uma alternativa às soluções tradicionais de bancos de dados em memória.

Conclusão

Do que tenho acompanhado, vejo claramente que (nunca antes na história deste planeta :) uma tecnologia foi tão rapidamente assimilada pelo mercado como estas relacionadas ao Big Data.

A evolução das ferramentas e o crescimento do ecossistema Hadoop ocorre na velocidade da luz, trazendo cada vez mais facilidades para uso da tecnologia pelas empresas.

Por isso, entendo que o recado é muito claro: a hora de começar a aprender, experimentar e adotar a tecnologia é agora, pois em breve o Hadoop vai virar commodity, e a vantagem competitiva para o profissional de TI que busque uma carreira nesta área desaparecerá.

Do ponto de vista das organizações, entendo que é hora de planejar iniciativas para 2015 que contemplem a utilização da tecnologia, e sugiro começar utilizando soluções mais simples de implementar, seja através de uma máquina virtual da Cloudera ou com o serviço EMR da Amazon.

quarta-feira, 23 de julho de 2014

Salvando vidas e economizando com Big Data


Em mais um exemplo claro do "poder" do Big Data, neste caso com uma ênfase muito importante para o aspecto da "Ciência de Dados" (Data Science para os gringos), um projeto desenvolvido pelo Centro de Ciência de Dados da Universidade de Washington está sendo usado num hospital com muito sucesso!

O projeto, chamado Risk-O-Matic, utiliza técnicas de aprendizado de máquina para prever, através de um indicador de risco, se um paciente que acabou de passar por um tratamento vai retornar ao hospital em pouco tempo (menos de 30 dias, por exemplo) por conta do mesmo problema, dentre outras possibilidades.

Para isso são usados muitos dados sobre o histórico médico e perfil do paciente compostos por mais de 100 atributos, que são analisados através de aplicações web e móveis.

Este tipo de projeto é de especial interesse do governo dos EUA e dos hospitais de lá por conta do famoso Obamacare, o programa de saúde que remunera hospitais com base na melhora dos indicadores de saúde, cujos custos chegam a 15 bilhões/ano apenas por conta do retorno aos hospitais, em menos de 30 dias, de 25% dos pacientes que acabaram de passar por tratamentos cardíacos. A idéia do governo é remunerar melhor hospitais que ajudarem a melhorar estes indicadores.

O projeto é ainda mais promissor por se tratar de iniciativa genérica, que pode ser aproveitada por qualquer governo, hospital, etc, de forma que os pesquisadores estão estudando montar uma empresa pra comercializar a solução, que também pode ser integrada a outras soluções médicas do mercado.

Fico cada vez mais fascinado por este novo mundo de possibilidades que se apresenta a partir das tecnologias de Big Data.

Quer conversar mais a respeito deste fascinante tema ? Deixe seu comentário aqui!

Via GigaOM.

sábado, 10 de maio de 2014

16 soluções para Big Data Analytics

Que Big Data é a buzzword do momento todos já sabem. O tratamento de grandes volumes de dados através da técnica de processamento paralelo Map/Reduce já influencia nosso dia a dia, e as grandes empresas já descobriram a importância de investir nesta tecnologia.

Por isso fiz uma pesquisa e encontrei 16 soluções para Big Data Analytics, que se refere à integração das ferramentas de Big Data com as ferramentas de software tradicionais presentes em praticamente qualquer organização, como bancos de dados relacionais, ferramentas de Business Intelligence e outras.

Distribuições Hadoop

Quando se trata de Big Data, o Hadoop é "a ferramenta", pois é o software central que permite a execução de operações de forma paralela aplicando a técnica criada pela Google denominada Map/Reduce, além de lidar com as questões de armazenamento e replicação de dados envolvendo componentes como HDFS e outros.

Por conta da importância deste software mantido pela Apache, surgiu o termo Distribuição Hadoop, que indica um conjunto de ferramentas que interagem de alguma forma com o Hadoop para fornecer alguma funcionalidade importante, seja a análise de logs em tempo real ou a coleta de dados a partir de redes sociais.

Uma das principais distribuições do mercado é a Hortonworks, que é 100% software livre e na qual se baseiam muitas outras, incluindo-se aí a distribuição da Cloudera e da Microsoft, dentre outras. Cada fornecedor tenta encontrar uma maneira de se diferenciar através das funcionalidades que oferecem além daquelas que já estão disponíveis na distribuição Hortonworks.

O ebook 16 soluções para Big Data Analytics

Neste ebook você vai encontrar as principais características de 16 soluções que incluem distribuições Hadoop, software especializado em bancos de dados NoSQL e soluções que englobam, além das ferramentas de Big Data, ferramentas tradicionais como bancos de dados relacionais e Business Intelligence.

Confira o ebook aqui.

segunda-feira, 21 de novembro de 2011

Tire suas dúvidas sobre certificação ITIL, COBIT, VMware, Big Data, Cloud, Linux e muito mais!


Prezados leitores,

Há algum tempo estou amadurecendo uma idéia que acredito que vão gostar!

Estive pensando em criar uma espécie de FAQ sobre assuntos comuns no blog e de interesse da maioria que nos acompanha, como Windows, Linux, Virtualização, ITIL, COBIT, essas coisas.

A idéia é ajudar no que puder, tirando as dúvidas de vocês e, quem sabe, de outros que busquem no Google pelas questões aqui respondidas.

Assim, está dado o pontapé inicial. Fiquem à vontade para postar seus questionamentos ou fazer sugestões sobre a idéia.