8
BIG DATA
É novidade!
voltarcomo fonte alternativa ou complementar aos inquéritos do INE
O INE
MANTÉM UM
ESFORÇO
CONSTANTE NA
BUSCA
E UTILIZAÇÃO DE
FONTES DE
INFORMAÇÃO ALTERNATIVAS AOS
SEUS
INQUÉRITOS
PARA
A
PRODUÇÃO
DAS
ESTATÍSTICAS
OFICIAIS
,
VISANDO
RACIONALIZAR
OS
RECURSOS
DE
QUE
DISPÕE
E
O
ESFORÇO DOS
RESPONDENTES
.
Para o INE, a potencial utilização de fontes alternativas aos seus inquéritos
temas seguintes principais finalidades:
Substituir total ou parcialmente as necessidades de efetuar inquéritos;
Validar e calibrar as operações estatísticas;
Atualizar as Bases de Unidades Estatísticas (alojamentos familiares e
empresas, na sua maioria), essenciais para a qualidade das amostras
dos inquéritos.
Entre as fontes alternativas encontram-se os chamados Dados
Administrativos e uma outra, que aqui se destaca, designada
internacionalmente por
BigData
.
Conceito de
Big Data
Pode definir-se
Big Data
como dados cuja origem não está relacionada com
o propósito da produção estatística oficial, por exemplo, com a
particularidade de serem difíceis de aceder, armazenar ou processar pelos
sistemas e capacidades técnicas convencionais.
A quantidade de dados, a
frequência com que são
produzidos e atualizados,
bem como a sua estrutura
conduziram a esse novo
conceito de fonte de dados.
A abundância de informação é uma constante no percurso
civilizacional, que não se restringe apenas à chamada revolução
digital; um exemplo disso pode ser a invenção da “imprensa”, no
Renascimento, que viria a dar origem à “inundação” do Ocidente com
uma vasta quantidade e variedade de livros.
Hoje, há cada vez mais dados disponíveis e gerados pela Internet, pela
integração de sistemas de produção e pela proliferação de sensores no
nosso dia-a-dia e que representam um desafio tecnológico e
metodológico no seu aproveitamento.
O termo
Big Data
foi utilizado pela primeira vez em 1997, num artigo
de Michael Cox e David Ellsworth (NASA), que evidenciou o facto de o
volume de dados emergir como um aspeto crítico na sociedade,
definindo esse fenómeno como “
o problema de BigData
”.
Em 2001, o analista Doug Laney (Gartner Group) publicou o artigo “3D
Data Management: Controlling Data Volume, Velocity, and Variety”.
Ainda hoje, esses 3Vs são aceites como as principais dimensões de
Big
Data
.
É
novidade!