Overview

O conjunto de dados utilizado é o resultado de uma rotulagem manual de 10 mil pedidos, divididos entre as categorias: Atendido, Parcialmente Atendido, Não Atendido e Não classificado.

Para cada pedido temos as informações referente ao órgão que recebeu a solicitação, o assunto, uma verificação se possui anexo atrelado ao pedido, a resposta fornecida pelo órgão, se é de nível Federativo, Estadual ou Municipal.

Para conhecer como é a distribuição de cada uma dessas variáveis iremos realizar um processo de visualização desses dados para ter um conhecimento de como é a base, nosso objetivo é analisa às informações referente as características dos pedidos e após esse processo analisar as mensagens dos pedidos.

Visualização das informações dos pedidos

Para uma análise iremos observar como está as distribuições na base em relação a cada uma das características comentadas anteriormente, considerando que no estudo anterior de origem essa base algumas informações já foram plotas e identificadas iremos filtrar para informações especificas de modelagem, portanto, iremos analisar como está a distribuição da base em relação às informações: distribuição de classes de atendimento, ter ou não anexo e área temática.

Observamos que a classe de pedidos atendidos é bem superior as demais classes, em números temos Atendidos com 4702, Não Atendidos 2637, Não Classificado 1820 e Parcialmente Atendido 1114. Um ponto importante para se considerar é que os não classificados não tende a contribuir com nossa análise e modelagem, portanto, iremos realizar a filtragem desses dados para podermos trabalhar apenas com as classes de pedidos que obtiveram uma resposta e uma classificação ao seu atendimento.

Como está a distribuição em relação às áreas temáticas dos pedidos?

Observamos que às áreas mais comuns é controle social e atividade fim, em relação as demais observamos um comportamento próximo à distribuição geral considerando que os pedidos atendidos tem uma maior distribuição na base, porém, para Processos observamos um comportamento atípico dos demais onde os pedidos dessa área tem uma distribuição maior em relação a não atendidos.

Como está a distribuição em relação a ter ou não anexo ?

Para essa analise consideramos que o anexo pode está presente tanto no pedido quanto na resposta do órgão a esse pedido, portanto iremos analisar às duas situações.

Observamos que pouco os pedidos que possui um anexo, nos mostrando ser difícil o requerente enviar algum anexo para o órgão solicitante.

Observamos que as respostas possuem um pouco mais de anexos em relação aos pedidos e observamos que quando tem anexado é provável que o pedido tenha sido atendido.

Visualização dos conteúdos dos pedidos e respostas

Para analisar melhor como é os dados em relação ao texto presente nos pedidos e suas respectivas resposta iremos realizar uma análise geral de como está essas distribuições, observar as palavras mais frequentes de cada categoria.

Quais palavras são mais frequentes em relação ao atendimento

Pedidos Atendidos

Observamos que em maioria as palavras mais frequentes remetem a solicitação de informações, algo que esperamos considerando as circunstâncias dos dados.

Resposta aos pedidos Atendidos

Observamos ser muito comum os órgãos responderem com algum link de URL que possa fornece as informações ao solicitante, no mais temos um formalismo para resposta algo que também é esperado.

Pedidos Parcialmente Atendidos

Além do que já observamos nos pedidos atendidos, temos a presença de Ano, Processo como algo bem frequente, isso pode nos dar uma visão que esses pedidos podem trazer a solicitação dessas informações em sua maioria.

Resposta aos pedidos Parcialmente Atendidos

A palavra processo também é bastante frequente nas respostas dos órgãos, isso pode ser entendido que órgão remete a palavra principal da solicitação, também observamos a frequência de URL nas respostas.

Pedidos Não Atendidos

Observamos que os pedidos seguem a característica das demais classes.

Resposta aos pedidos Não Atendidos

Antes de realizar a visualização vamos realizar uma substituição para os casos NaN (13 no total) que seria quando o órgão não respondeu à solicitação ser substituído por uma ‘string’ vazia.

Observamos que para esses casos é bem comum o órgão comunicar que não pode repassar determinada informação por conta da lei de acesso à informação.