Coletando Dados em Mídias Sociais para Pesquisa Acadêmica

Na última semana, aconteceu em São Carlos a Jornada Internacional Geminis, que agregou centenas de pesquisadores de todo o Brasil e conferencistas internacionais para debater produção audiovisual, comunicação e internet. Estivemos presentes com a participação de Tarcízio Silva, que participou de mesa “A Revolução Será Monitorada?” e ofereceu workshop sobre Coleta de Dados e Monitoramento de Mídias Sociais para Pesquisa Acadêmica. O workshop apresenta um panorama da pesquisa científica em comunicação baseada em dados empíricos de mídias sociais e algumas técnicas e ferramentas como Netlytic, Netvizz, Uberlink, Instagram Scraper e ferramentas comerciais de monitoramento. Acesse os slides:

Leia Mais

Curso de Monitoramento de Mídias Sociais: novas turmas

Em maio o IBPAD realizou duas turmas do curso de Monitoramento de Mídias Sociais, em Brasília e em São Paulo. Na edição de Brasília de 14 e 15 de maio, o prof. Tarcízio Silva, idealizador do curso, apresenta o escopo do conteúdo, focado em transformar dados das mídias sociais em informações acionáveis:

Em São Paulo, o prof. Wesley Muniz é responsável pela condução das atividades. A turma foi composta de profissionais de diversos backgrounds, que puderam debater sobre as particularidades de cada etapa do monitoramento de mídias sociais em seus cotidianos de trabalho:

Jpeg

O caráter misto das turmas sublinha a pervasividade dos dados de mídias sociais nos campos acadêmicos e mercadológicos, de áreas como Publicidade, Relações Públicas, Educação e outras. Os alunos contaram um pouco sobre suas percepções do curso:

O IBPAD agradece à turma presente nas edições e convida interessados para a próxima edição! Acontecerá em 09 e 16 de julho em São Paulo, com o prof. Wesley Muniz.

______________________________

Monitoramento de Mídias Sociais (São Paulo)

Data: 09 e 16 de Julho de 2016

Horário: 09h às 12h e de 14h às 18h

Inscreva-se!

Leia Mais

Monitoramento: acompanhar desempenho de campanhas é só a ponta do iceberg

[Texto do prof. Wesley Muniz, que faz parte do time de professores de Monitoramento de Mídias Sociais no IBPAD]

Quando se fala em monitoramento de mídias sociais, a primeira coisa que pensamos quando temos o mínimo do conhecimento sobre o mercado de mídias sociais é sua função para o acompanhamento de acontecimentos e conversas sobre marcas nas diversas redes sociais. Um olhar de cima sobre o que acontece por baixo. Porém, um monitoramento eficiente é justamente um olhar de todos os ângulos sobre o que acontece em qualquer lugar.

Monitoramento não é apenas “ver” ou “escutar” o que os usuários dizem em seus meios sociais sobre determinados assuntos, produtos ou marcas. A fase de “ouvir” não é nem o pico de um grande iceberg que envolve todos os processos da importância que o monitoramento de mídias sociais representa em uma campanha ou estudo de usuários e conteúdo.

Assim como em um iceberg (em que geralmente apenas 10% de sua massa emerge à superfície), um monitoramento de mídias sociais pode ser mais complexo, envolvendo um planejamento robusto que pode evitar que um monitoramento que serviria para reportar o desempenho de uma campanha, cometa erros que comprometam o sucesso da mesma campanha.

monitoramento - iceberg

Monitorar é gerir. Se você jogou SimCity, um jogo que simula a administração de uma cidade, vai entender muito bem do que estou falando. Em SimCity, todas as ações do administrador da cidade são baseadas em seu monitoramento do que faz um cidadão do jogo feliz, o que inclui suas necessidades mais básicas (como saneamento, pavimentação etc.), quanto as mais “luxuosas” como o entretenimento. Conhecer aspectos culturais é tão necessário que tomar uma ação sem embasamento nos cidadãos pode fazer com que a avaliação positiva do “prefeito” caia drasticamente.

sim city

Um planejamento de monitoramento não é diferente disso. A metodologia pode ser tão complexa que, mesmo dentro do monitoramento, alguns profissionais acabam se especializando em processos específicos, como monitoramento político, social listening, mapeamento de usuários, SAC 2.0, benchmarking, estudo de conteúdo, tendências de mercado e outras diversas possibilidades que uma área de estudo não tão nova como se pensa pode fornecer.

Já ouvi profissionais dizerem que têm medo de entrar na área de monitoramento achando que é “humanas demais” pelas análises comportamentais frequentes e conversas de pessoas que precisam ser analisadas até mesmo com background cultural abrangente. Ainda há quem pense que o monitoramento pode conter elementos de “exatas demais”, devido a sua exigência de compreensão de dados e análises gráficas que podem até ser um pouco mais complexas.

A verdade, se é que existe uma, é que o monitoramento alinha estes dois polos de estudo, humanas e exatas, em uma medida tão equilibrada em certos pontos que acaba se tornando uma ciência de extrema importância para as campanhas nas mídias sociais quanto fora delas. E pode ser mais divertido do que se imagina.

nem exatas nem humanas - monitoramentos

Imagine se você pudesse ler a mente das pessoas e dar a elas o que elas querem antes mesmo de elas pedirem, surpreendendo-as. Pois é praticamente isso que o monitoramento de mídias sociais faz. Nós lemos e identificamos nas conversas aquilo que os usuários e os consumidores querem ou fazem, e que muitas vezes nem eles mesmos ou as marcas sabem. Somo videntes de interpretações sociais e de dados.

Ainda no âmbito de possibilidades profissionais, um(a) bibliotecário(a), um matemático(a), um(a) jornalista(a) e até um(a) biólogo(a) possuem traços analíticos muito importantes e necessários, com bagagens culturais e científicas com ótimo grau de contribuição para o crescimento e discussão do mercado de monitoramento de mídias sociais. E estes profissionais muitas vezes nem sabem o quão podem ser necessários.

Monitoramento não é um trabalho limitado ao acompanhamento. É um trabalho do qual se extrai muitos insumos e informação, retroalimentando uma campanha, fazendo parte da própria campanha. Por isso merece tamanha atenção.


Conheça o curso de Monitoramento de Mídias Sociais no site do IBPAD.

Leia Mais

Inscrições abertas para novas turmas de Programação em R

Durante o mês de Abril, o IBPAD promoveu duas turmas do curso de Programação em R. Com o Professor Carlos Cinelli, em Brasília, e o Professor Guilherme Jardim Duarte, em São Paulo, o programa do curso apresenta conceitos sólidos da linguagem R e boas noções de análise de dados utilizando a ferramenta. 

Max Stabile, fundador e Diretor-Executivo do IBPAD, apresenta nossos professores e explica melhor a experiência do Instituto com o curso e as aplicações dele no cotidiano do profissional de análise de dados.

 

 

Em Brasília, o Professor Cinelli começou com a apresentação ao R e ao R Studio e passou por vários pacotes específicos, sempre utilizando exemplos práticos para aplicação dos conceitos apresentados.

 

Turma R - Brasília

Programação em R – Alguns alunos da turma de Brasília com Professor Carlos Cinelli

 

A turma de São Paulo, liderada pelo Professor Guilherme Jardim Duarte, também partiu da apresentação e noções básicas, como a definição de data-frame e da orientação de leitura de dados, para funções básicas do R e alguns pacotes que facilitam a análise cotidiana.

 

Turma R - São Paulo

Programação em R – Alguns alunos da turma de São Paulo com Professor Guilherme Jardim Duarte

 

Nossos alunos falaram um pouco sobre a experiência de aprender R com o IBPAD e sobre suas perspectivas de utilização do conhecimento daqui para frente. Confira suas contribuições nestes depoimentos.

 

 

O IBPAD agradece todos os alunos que fizeram parte dessa primeira turma e anuncia que as inscrições para novas turmas estão abertas! Em Brasília, o curso acontecerá todos os sábados, de 09 a 30 de Julho, no Instituto Brasileiro de Direito Público (IDP). Em São Paulo, o Professor Guilherme Jardim Duarte coordena os trabalhos, também todos os sábados, de 30 de Julho a 20 de Agosto.

 

Não perca esta oportunidade de criar diferencial em sua carreira.

Para mais informações sobre o curso, acesse o site do IBPAD.


Programação em R (Brasília)

Data: Todos os sábados, de 09 a 30 de Julho de 2016

Horário: 09h às 12h30 e de 13h30 às 18h

Inscreva-se!

Programação em R (São Paulo)

Data: Todos os sábados, de 30 de Julho a 20 de Agosto de 2016

Horário: 09h às 12h30 e de 13h30 às 18h

Inscreva-se!

Leia Mais

Como monitorar mídias sociais com a Netlytic

netlyticAs ferramentas de monitoramento e pesquisa em mídias sociais desenvolvidas por universidades e grupos de pesquisa frequentemente superam em diversos aspectos, sobretudo inovação, as ferramentas comerciais. Além disso, costumam ser de baixo custo quando comparadas às ferramentas comerciais de monitoramento pleno.

Um exemplar é a Netlytic, uma das mais interessantes soluções para pesquisadores acadêmicos interessados em mídias sociais, assim como uma excelente ferramenta de apoio para projetos comerciais. A Netlytic foi desenvolvida por Anatoliy Gruzd, professor da Ryerson University (Canadá) e diretor do Social Media Lab, além de co-editor da excelente revista Big Data and Society.

Planos

A primeira vantagem da Netlytic são seus planos incrivelmente baratos. A tabela abaixo descreve os três planos (“Tiers”) disponíveis. O primeiro permite até 3 datasets de 2500 registros/ocorrências cada. É gratuito, assim como o segundo plano, que permite até 5 datasets de 10 mil registros/ocorrências. Este volume, por exemplo, já é bem superior ao volume médio de unidades de conteúdo analisadas em artigos publicados no Intercom, 1.291 (SILVA, 2014). A realidade de abrangência de coleta está mudando, mas não deixa de ser um número relevante que atende a maior parte das necessidades de coleta de dados empíricos nas mídias sociais.

Netlytic - planos

A surpresa, entretanto, fica no Tier 3. Ao permitir 300 datasets com 100.000 ocorrências cada, significa um volume de até 30 milhões de unidades de conteúdo por ano. O plano anual custa 108 (Estudante), 228 (Pesquisador/Não-Lucrativo) ou 348 (Comercial) dólares canadenses. Isto converte para 209, 614 ou 937 reais. O valor por ano, então, é irrisório para agências e projetos comerciais e justo para pesquisadores acadêmicos.

Plataformas e Fontes de Busca

netlytic - midias

A Netlytic permite coletar dados a partir de seis tipos de fontes diferentes: Twitter, Facebook, YouTube, Instagram, Feeds e Google Drive.

Twitter | A busca no Twitter solicita uma simples autenticação com algum perfil e coleta em cada requisição até 1 mil tweets. É possível configurar a ferramenta para fazer requisições a cada 15 minutos. Todos parâmetros e operadores de busca que funcionam no Twitter podem ser inseridos aqui, como OR, AND e from:username, por exemplo.

Facebook | Coleta a cada hora até 25 comentários nos últimos 100 posts em páginas, grupos ou eventos, com requisições de hora em hora. Respostas a comentários não são coletadas.

Instagram | Atualmente com API mais aberta, é possível coletar até 10 mil fotos/vídeos a cada hora.

YouTube | No YouTube, a ferramenta faz uma coleta única de todos os comentários de um vídeo específico.

RSS | Coleta diária de conteúdo de RSS.

Arquivo de Text / Google Drive | Permite a importação de arquivos .csv construídos a partir de bases de emails, com colunas de emissor, destinatário, assunto, data e mensagem.

Criando Buscas e Dataset

A criação de novas buscas é muito simples. Na página “New Dataset”, o menu abaixo será exibido, onde é possível escolher a fonte desejada e preencher o nome do Dataset e adicionar os parâmetros adequados de busca, como keywords, hashtags, latitude/longitude, ID ou vanity URL.

netlytic menu - new dataset

No caso do Twitter, por exemplo, basta escolher um título (apenas para identificação); adicionar keywords de busca; e escolher se a busca deve ficar ativa e por quantos dias. No exemplo abaixo, a busca inclui uma palavra, uma hashtag e dois termos de exclusão:

Netlytic - dataset Twitter

Analisando os Dados: Preview e Exportação de CSV

Ao se criar o Dataset, a depender da mídia já ocorrerão resultados imediatos ou em até 15 minutos. Um exemplo desta página de “Preview” pode ser vista abaixo:

Netlytic - preview - transicaocapilar

A página mostra os últimos 1000 resultados. É nela que é possível limpar o texto (Clean Text), removendo palavras específicas da base de dados, além de realizar a exportação de tudo o que foi coletado em formato .csv. Deste modo, o pesquisador pode fazer sua codificação e análise em softwares externos como Excel, R, Iramuteq, AntCont, Voyant Tools etc…

Cada tipo de mídia traz um CSV com colunas diferentes. No caso do Twitter traz uma miríade de informações: id, link, autor, imagem do perfil, conteúdo do tweet, aplicativo de publicação, número de tweets, número de seguidos, número de seguidores, data de criação do perfil, bio, localização, coordenadas.

Há limitações que devem ser levadas em conta. A imagem abaixo mostra a exportação de posts e comentários da página do PMDB Nacional. Estão selecionadas várias células que possuiriam conteúdo textual dos comentários, mas estão vazias pois está ocorrendo um “vomitaço” na página do partido. Como os comentários são stickers do Facebook, a ferramenta não consegue identificar:

netlytic - exportação Facebook

Analisando os Dados: Text Analysis

Depois de coletados os dados, a página Text Analysis traz duas opções: Keyword ExtractorManual Categories. A primeira é bastante intuitiva para qualquer pessoa que já tenha utilizado uma ferramenta de monitoramento de mídias sociais. A primeira função dela é a simples contagem de palavras mais frequentes (Words Cloud):

netlytic - palavras mais frequentes

A segunda função mede a evolução de frequência de palavras ao longo do tempo (Words Over Time), permitindo identificar relevância de tópicos e visualizar as keywords em contexto:

netlytic - words over time

netlytic - words over time - keyword in context

netlytic - manual categorias - feelings good - exemploO recurso de Manual Categories realiza a classificação automatizada a partir de regras baseadas em keywords inseridas pelo pesquisador ou a partir de categorias padronizadas de menções a Appearance, Feelings (Bad), Feelings (Good), Quantity, Shape, Size, Sound, Taste, Time e Touch.

A imagem ao lado apresenta um excerto das palavras relacionadas a Feelings (Good), por exemplo.

 

 

 

Analisando os Dados: Network Analysis

Talvez o módulo de análise de redes da Netlytic seja seu melhor recurso. A partir das conexões entre os perfis monitorados, é possível gerar visualização de redes própria da ferramenta. Além de métricas simples como Grau, Grau de Entrada e Saída, a ferramenta traz três algoritmos de visualização: o Fruchterman-Reingold, que usuários de NodeXL ou Gephi devem conhecer, e dois algoritmos próprios: DrL Layout e LGL Layout. O DrL oculta arestas longas, permitindo evidenciar melhor os clusters. O segundo mostra apenas o maior componente conectado. As imagens abaixo comparam visualizações a partir dos mesmos dados:

netlytic - visualizacao em rede

netlytic - visualizacao em rede - DrL

netlytic - visualizacao em rede - LGL

Veja o básico sobre análise de redes em documento do NetSciEd (2015).

 

Relatório

Por fim, a Netlytic oferece um relatório compilando os principais dados levantados. É composto de 8 áreas: Dataset Stats, Geotagged Posts, Source Data: Top Ten Posters, Source Data: # of Posts over Time, Top 10 Most Frequently Used Words, Text Analysis: Manual Categories, Network: Top 10 Posters Mentioned in Messages e Save Network Images.

Os primeiros dois itens são detalhes sobre o Dataset e o mapa de menções. A utilidade deste gráfico variará muito a depender da plataforma. Como é baseado nas coordenadas exatas, são pouquíssimos dados no Twitter, pois os usuários quase não usam o recurso. No Instagram o número é um pouco maior, mas ainda assim baixo. Na tela a seguir, apenas 2% das fotos sobre #transicaocapilar possuem localização exata:

netlytic - geotagged posts

Os dados de principais emissores e volume de posts ao longo do tempo, por outro lado, são exatos e já podem trazer informações acionáveis:

netlytic - emissores mais frequentes e volume de posts

As palavras mais frequentes e categorias manuais são os gráficos seguintes. No exemplo abaixo, análise sobre os últimos mil tweets contendo a palavra “Brazil” em inglês:

netlytic - top 10 most frequent words e manual categories

Por fim, as duas últimas áreas do relatório estão ligadas ao módulo de network analysis. Para que sejam exibidas, é necessário que antes o usuário tenha gerado uma rede e salvo imagem de visualização. Ainda é possível incorporar os gráficos, como no exemplo abaixo:

 

Aplicações

As aplicações do Netlytic são inúmeras para quem trabalha comercialmente na área. Variados tipos de análise e relatórios podem ser realizados a partir do monitoramento contínuo de temas no Twitter, estudos extrativos sobre comportamento internacional em canais do YouTube ou Grupos do Facebook, insights sobre uso geolocalizado de mídias etc são apenas alguns exemplos. É importante lembrar das limitações da ferramenta, entretanto. A Netlytic não inclui recursos de classificação manual, filtragem de dados, visualização de informações por usuário, interface amigável e inúmeras outras funções comuns nas ferramentas comerciais. No IBPAD a utilizamos como ferramenta de apoio, enquanto os projetos comerciais sãoo monitorados em ferramentas plenas de monitoramento como Stilingue, Vtracker e BrandCare.

Para pesquisadores acadêmicos, estudantes de graduação, mestrado e doutorado estudando mídias sociais, a Netlytic pode ser ainda mais útil. Ao permitir coleta facilitada de dados, a ferramenta expande os recursos disponíveis aos pesquisadores, que frequentemente são privados de recursos para executar suas pesquisas. Trabalhos com a Netlytic incluem estudos sobre busca de informação sobre lazer (ALYAMI & TOZE, 2014), comunidade de fãs (MARTIN, GRUZD e HOWARD, 2013), ativismo contra violência contra mulheres indígenas (FELT, 2016), discurso sobre organismos geneticamente modificados (MUNRO, HARTT & POHLKAMP, 2015), entre outros.

 

Onde Aprender Mais

Nossos cursos de Análise de Redes para Mídias Sociais e Monitoramento para Mídias Sociais incluem exercícios de coleta de dados com a Netlytic na programação. Além disto, atividades em universidades como o recente workshop no NEPAC-Unicamp e o workshop oferecido na Jornada Internacional Geminis em maio incluem exploração da ferramenta.

 

Referências

ALYAMI, Eman; TOZE, Sandra. ??? Where to go on the weekend???? Trends for local information seeking in leisure settings using social media. In:Information Society (i-Society), 2014 International Conference on. IEEE, 2014. p. 169-172.

DUBOIS, Elizabeth. Trace Interviews Step-By-Step. Ethnography Matters, 2016.

GRUZD, A. & HAYTHORNTHWAITE, C. ; Enabling community through social media. Journal of Medical Internet Research 15(10):e248, 2013.

FELT, Mylynn. Social media and the social sciences: How researchers employ Big Data analytics. Big Data & Society, v. 3, n. 1,  2016.

MARTIN, Jennifer; GRUZD, Anatoliy; HOWARD, Vivian. Navigating an imagined Middle–earth: Finding and analyzing text–based and film–based mental images of Middle–earth through TheOneRing.net online fan community. First Monday, vol. 18, n.5-6, maio de 2013.

MUNRO, Katherine; HARTT, Christopher M.; POHLKAMP, Gretchen. Social Media Discourse and Genetically Modified Organisms. The Journal of Social Media in Society, v. 4, n. 1, 2015.

NETSCIED. Network Literacy: Essential Concepts and Core Ideas. 2015. Trad. por Tarcízio Silva: Iniciação a Redes – Conceitos Essenciais e Principais Ideias, 2015.

SILVA, Tarcízio. Pesquisa baseada em Dados Sociais Digitais: mapeamento de ferramentas e táticas de coleta de dados no IntercomRazón y Palabra, n.90, 2015.

Leia Mais

IBPAD realiza minicurso “O uso das redes sociais como fonte de pesquisa na Ciência Política” na Unicamp

A professora Débora Zanini ofereceu o minicurso “O uso das redes sociais como fonte de pesquisa na Ciência Política” na Unicamp nos últimos dias 29 e 30 de abril. Organizado pelo Núcleo de Pesquisa em Participação, Movimentos Sociais e Ação Coletiva (NEPAC), a atividade de 7 horas buscou introduzir a participantes do grupo e demais interessados a particularidades e técnicas de coleta de dados nas mídias sociais.

Curso IBPAD Debora Zanini - Netlytic
Professora Débora Zanini apresenta a ferramenta Netlytic aos alunos

 

O módulo 1 do curso tratou das mídias sociais mais utilizadas no país; seu público; comportamento de interação e troca de informações entre os usuários; dados disponíveis para coleta (scraping ou API); e exemplos de estudos na área política que usam dados de mídias sociais como base. O módulo 2 focou em ferramentas disponíveis para coleta de dados (especialmente gratuitas e criadas na academia como a Netlytic) e metodologias de busca (buscas booleanas e construção de queries) e de estruturação de dados. Algumas das telas da aula:

Minicurso IBPAD - Coleta de Dados - Unicamp - capa

Minicurso IBPAD - Coleta de Dados - Unicamp - dados YouTube

Minicurso IBPAD - Coleta de Dados - Unicamp - redes e complexidade

O IBPAD tem como objetivo estreitar os laços com universidades, pós-graduações e grupos de pesquisa em áreas correlatas. Caso sua instituição possua interesse, só entrar em contato conosco. A próxima atividade em universidades será o workshop “Monitoramento e Coleta de Dados em Mídias Sociais para Pesquisa Acadêmia”, realizada por Tarcízio Silva na Jornada Internacional Geminis em 17 de maio.

Leia Mais

IBPAD participa da conferência “Racismo e Discurso de Ódio na Internet: Narrativas e Contra-Narrativas”

Entre 27 e 29 de abril aconteceu, no Rio de Janeiro, a conferência “Racismo e Discurso de Ódio na Internet: Narrativas e Contra-Narrativas”, promovida pelo Berkman Center, da Universidade Harvard, em parceria com a plataforma Vojo Brasil. Nosso Diretor de Pesquisa em Comunicação, Tarcízio Silva, participou da mesa “Próximos passos: como mensurar o discurso de ódio e o racismo online?” com Renato Meirelles (DataPopular) e Fábio Senne (Cetic.br).

Abertura da Conferência
Abertura da Conferência

(mais…)

Leia Mais

Transição capilar e empoderamento nas mídias sociais

[O texto abaixo é uma colaboração de Nadja Santos, fundadora do projeto Zero.54, com apoio do prof. Tarcízio Silva, ambos membros do grupo de pesquisa Estética Afro-Brasileira nas Mídias Sociais, promovido pelo IBPAD]

Brasileiros crescem acreditando que o cabelo é moldura do rosto e, por diversos motivos que falaremos a seguir, mulheres e homens negros tentam se adaptar a cultura dos fios lisos e escorridos – ainda muito popular no Brasil.  Nos últimos anos, muitos deles têm rompido com os padrões estéticos vigentes ao abandonarem o alisamento químico que os levam aos salões de beleza toda semana; mulheres em sua grande maioria. Este processo chamado de “Transição capilar” é muito mais do que moda ou tendência; o movimento se tornou uma necessidade em um momento peculiar na vida do brasileiro.

Comparação de volume de buscas sobre alisamento e transição capilar.
Comparação de volume de buscas sobre alisamento e transição capilar.

Pela primeira vez, 54% da população se considera negra e reafirmar a própria identidade se tornou essencial.  Independente do tom de pele, a população negra começou por onde mais eles são identificados: o black power. O fenômeno está muito ligado também ao fato da população negra estar cada vez mais dentro das universidades, ambiente ainda majoritariamente branco e elitizado no Brasil.

Dentro do patriarcado capitalista – o contexto social e político em que surge o costume entre os negros de alisarmos os nossos cabelos –, essa postura representa uma imitação da aparência do grupo branco dominante e, com freqüência, indica um racismo interiorizado, um ódio a si mesmo que pode ser somado a uma baixa auto-estima. Bell Hooks, escritora, no ensaio “Alisando nosso cabelo”

No #instamission283 que teve como tema a transição capilar, ficam claras as motivações e influenciadoras desta decisão tão importante. Em uma espécie de manifesto pró-afro, cada cabelo tem uma história muito semelhante de superação e empoderamento diante do apagamento das próprias raízes. Apesar de 70% das brasileiras terem cabelo cacheado e crespo, assumir os cachos se tornou um ato de coragem porque ao redor delas está uma pátria de alisadas. Segundo dados da consultoria Kantar Worldpanel, cerca de 25 milhões de brasileiras utilizam escova progressiva.

Nuvem de Palavras - instamission283
Hashtags mais comuns nas fotografias participantes do desafio

 

 

 

 

 

 

 

 

 

(mais…)

Leia Mais

Análise de Texto – Os discursos dos Deputados na sessão de votação do Impeachment

O Jornalista e Professor em Ciência Política Fábio Vasconcelos publicou no Blog Na Base dos Dados uma rápida análise que fizemos sobre os discursos parlamentares da sessão de votação do Impeachment do dia 17 de Abril na Câmara dos Deputados.

Para quem ficou curioso, a base de dados foi o PDF (sim, acreditem) da Câmara dos Deputados. Tentei puxar os dados dos discursos via R utilizando o pacote bRasilLegis, mas descobri que os dados só serão liberados entre hoje (19) e amanhã. (Atualizado: os discursos já estão disponíveis)

Depois do tratamento do PDF eu utilizei o Iramuteq. Para quem não conhece, o Iramuteq é uma “interface visual ” para utilizar o R e produzir análise de texto. É um “filho/primo” de um conhecido software de análise de texto francês chamado Alceste. Suas técnicas, portanto, são fortemente baseadas na literatura francesa de análise textual.

Uma das técnicas mais interessantes do Iramuteq é o método Reinert de agrupamento de proximidade de palavras. De uma maneira bem simples, ela permite achar grandes grupos temáticos em um corpus de texto.

No exemplo que fizemos, encontramos quatro grandes grupos:
Termos

(mais…)

Leia Mais

Previsões do Impeachment: usando análise de dados como informação de contexto político

previsoesCompreender o cenário brasileiro atual passou a ser um grande desafio para diversos acadêmicos e profissionais do mercado de relações governamentais. A análise das instituições políticas brasileiras passou por várias fases desde a redemocratização e buscou, em sua maioria, compreender os diferentes contextos políticos através da descrição de elementos contemporâneos e de tendências construídas a partir de comportamentos passados.

No entanto, a singularidade e complexidade do processo de impeachment do atual Governo Federal gerou esforços mais robustos em seu aspecto metodológico, seja pela análise descritiva de uma gama maior de dados ou pela previsão inferencial do comportamento parlamentar delimitada por ferramentas estatísticas já consolidadas na academia, mas ainda pouco mobilizadas pelo mercado de assessoria e consultoria.

A função da análise de dados, principalmente nestes últimos casos, não é criar pressupostos rígidos, mas orientar compreensões e agregar valor à análise do conjunto de eventos simultâneos envolvidos no processo de impeachment.

Algumas compilações das diferentes análises descritivas e previsões inferenciais do impeachment já foram realizadas pelo Blog Análise Real e pelo Jornal Nexus, mas cabe ainda descrever um pouco melhor cada caso proposto, controlando a evolução de complexidade das ferramentas de análise de dados utilizadas e mostrando como tal análise é um fator de diferenciação, tanto em termos acadêmicos como mercadológicos.

(mais…)

Leia Mais