Um dashboard para tomada de decisão considerando dados abertos de rodovias federais

Rodrigo Gabriel de Miranda

rgabrieldemiranda@gmail.com

Universidade Federal de Santa Catarina - UFSC, Florianópolis, SC, Brasil.

Andréa Cristina Konrath

andreack@gmail.com

Universidade Federal de Santa Catarina - UFSC, Florianópolis, SC, Brasil.

Maicon Rafael Zatelli

maicon.zatelli@ufsc.br

Universidade Federal de Santa Catarina - UFSC, Florianópolis, SC, Brasil.

Yohana Taise Hoffmann

yohana.thc@gmail.com

Universidade Federal de Santa Catarina - UFSC, Florianópolis, SC, Brasil.

Silvio Aparecido da Silva

silvioest@gmail.com

Universidade Federal de Santa Catarina - UFSC, Florianópolis, SC, Brasil.


RESUMO

Destaques: A lei de acesso à informação garante que os dados sejam disponibilizados à população. Estes dados estão em forma bruta, sem real utilidade. Os registros de acidentes de trânsito podem ser mais informativos. Para isto é preciso desenvolver tecnologias web com base em conceitos de projeto de ciência de dados. Objetivo: Desenvolver um dashboard informativo, com interface amigável e tecnologia web, para disponibilização de dados úteis e simplificados à população. Metodologia: Foram coletados dados referentes aos acidentes em rodovias federais brasileiras, registrados pela Polícia Rodoviária Federal e disponibilizados como dados abertos. A partir dos princípios determinados pela Open Government Data e por meio de conceitos de projetos de ciências de dados associados à linguagem de programação R, elaborou-se um dashboard para consulta interativa dos dados de acidentes nas rodovias federais. Resultados: O dashboard desenvolvido é capaz de fornecer informações com interface amigável, relacionando os acidentes registrados com parâmetros ambientais e condições da rodovia, tais como condição climática, características de trechos das rodovias, região, temporalidade, sexo e idade do condutor, entre outros. As informações são apresentadas no dashboard por meio de gráficos, tabelas, mapas interativos, com possibilidade de pesquisar acidentes pela combinação de filtros, além de permitir o acesso a informações diretas de estatísticas de acidentes. Implicações práticas: O dashboard desenvolvido, por fornecer dados úteis apresentados de forma clara e simplificada, serve de subsídio para estratégias de prevenção a acidentes em rodovias. Estas podem ser empregadas pelo próprio Departamento de Polícia Rodoviária Federal, a fim de reduzir os transtornos causados pelos acidentes de trânsito. Originalidade: Este modelo de dashboard, focado especificamente em gestão de informações sobre acidentes de trânsito, traz a inovação do processamento e análise de dados de rodovias federais. Por isto, se preza a contribuir com a gestão pública de acidentes de forma simples a fornecer informações simplificadas à população.

Palavras-chave: Acessibilidade; Inclusão digital; Análise de dados; Acidentes de trânsito.


INTRODUÇÃO

As Tecnologias de Informação e Comunicação (TICs) estão cada vez mais presentes, tendo contribuído para mudanças em diversos aspectos da população, especialmente naqueles relacionados ao acesso às informações disponíveis nas bases de dados. A sociedade vem exigindo que as organizações governamentais ofereçam uma melhor qualidade de seus serviços, especialmente no que se refere à transparência na gestão dos recursos públicos. No que tange à administração pública, o setor trabalha com grande volume de dados diariamente, entretanto, nem sempre estes dados estão disponíveis para a população de forma apropriada.

Essa problemática gerou movimentos no pensamento administrativo, como o Governo Aberto, que segundo Veljković et al. (2014) iniciou com medidas vindas do governo norte-americano, para o aumento dos mecanismos de transparência. A consolidação do Governo Aberto veio com a declaração oficial do Open Government Partnership (OGP), do qual o Brasil e mais sete países fazem parte desde 2011 (Open Government Partnership, 2011).

Os mecanismos de transparência estão relacionados à disponibilização dos dados abertos, por meio dos quais é possível conhecer as ações governamentais de forma mais detalhada (Silva et al., 2014). Segundo a definição da Open Knowledge Foundation (OKF), os “dados são abertos quando qualquer pessoa pode livremente usá-los, reutilizá-los e redistribuí-los, estando sujeito, no máximo, à exigência de creditar a sua autoria e compartilhar pela mesma licença” (OKF, 2020). Conforme Attard et al. (2015), diferentes ações mundiais de dados abertos governamentais surgiram na última década, e têm como objetivo a transparência e a reutilização dos dados.

No Brasil, foi criada a Lei nº 12.527, de 18 de novembro de 2011 (Brasil, 2011), conhecida como “Lei de Acesso à Informação”. Por intermédio dela, os dados governamentais foram disponibilizados, mas em muitas situações apenas em sua forma bruta, como em forma de registros em tabelas, ou Application Programming Interface (API), necessitando algum tipo de processamento para que se torne uma informação.

Dentre os dados públicos abertos pelo governo brasileiro estão as bases relacionadas aos acidentes de trânsito, que estão disponíveis no site do Departamento de Polícia Rodoviária Federal (DPRF, 2019a). Porém, tais dados estão atualmente disponíveis de forma bruta, apenas como tabelas. Assim, ao acessar esse banco de dados, as informações não estão dispostas de maneira direta, a fim de contribuir para responder questionamentos como: (i) em qual mês do ano ocorrem mais acidentes em determinada rodovia; (ii) em quais trechos de determinada rodovia ocorrem mais acidentes; (iii) como é a distribuição dos acidentes em determinada rodovia, considerando o tipo de pista (simples, dupla, múltipla); (iv) como é a distribuição dos acidentes em determinada rodovia, considerando a gravidade (sem vítimas, com vítimas feridas, com vítimas fatais); (v) quais são as principais causas de acidentes em determinada rodovia; e (vi) qual é a faixa de idade mais comum das pessoas envolvidas em acidentes em determinado estado. Além disso, explorar esse tipo de dados, na maioria das vezes, se torna difícil, uma vez que exige conhecimento técnico na área e por necessitar de técnicas mais avançadas de análise (Braunschweig et al., 2012).

Acidentes de trânsito são apontados como as principais causas de mortalidade de jovens no mundo, sendo considerada a primeira causa na faixa etária de 15 a 29 anos e a segunda na de 5 a 14 anos. Além disso, estima-se que em 2016 cerca de 1,35 milhões de pessoas morreram em decorrência de acidentes de trânsito (WHO, 2018). Considerando a proporção desses números, essa temática vem sendo abordada como importante assunto de saúde pública. No Brasil, uma série de ações implementadas pela Federação e pelos governos estaduais e municipais (campanhas educativas, que englobam o Maio Amarelo e a Semana Nacional de Trânsito; a intensificação na fiscalização, como a blitz da Lei Seca; o aprimoramento da segurança dos veículos; e as medidas de engenharia de tráfego, como a modernização das rodovias) vêm reduzindo o número de mortes por acidentes de trânsito anualmente. Entre 2015 e 2019 houve uma queda anual de 7% no número de mortes que, de acordo com o Departamento de Informática do Sistema Único de Saúde (DataSUS), é uma redução de 43 mil para 30 mil mortes por ano (Governo do Brasil, 2020).

Os acidentes de trânsito custam cerca de 3% de seu produto interno bruto (PIB) para grande parte dos países (Organização Pan-Americana da Saúde, 2019). Considerando tanto custos diretos como indiretos do ano de 2014, os acidentes de trânsito geraram um prejuízo em torno de R$ 40 bilhões ao Brasil, e destes, R$ 12,3 bilhões decorrem de acidentes em rodovias federais (Instituto de Pesquisa Econômica Aplicada, 2015). Deste modo, é possível perceber que o alto número de acidentes de trânsito afeta diretamente a economia nacional (Tischer, 2019).

A partir dessa problemática, este artigo tem como objetivo apresentar uma ferramenta (em formato de dashboard) que transforma os dados abertos referentes aos acidentes de trânsito disponibilizados pelo DPRF em informação disponível à população em geral e também para a administração pública, em especial o próprio DPRF. Por um lado, ao acessar o dashboard, a população em geral pode obter respostas de maneira mais direta para questões como as elencadas anteriormente. Por outro lado, o dashboard apresenta informações já trabalhadas e mais estruturadas do que o banco de dados disponível atualmente pelo site do DPRF e, assim, também serve como subsídio para estratégias de prevenção a serem empregadas pelo próprio DPRF, a fim de reduzir os transtornos causados pelos acidentes de trânsito, tais como decidir sobre determinado trecho a ser mais fiscalizado por policiais durante certo período do ano, dia da semana ou horário do dia, sobre localização de um novo posto de atendimento ou nova fiscalização eletrônica. A própria administração da rodovia (seja pública ou privada) também teria mais informações para, por exemplo, decidir sobre obras de infraestrutura, sinalização de trechos e suporte aos usuários da rodovia.

Dentre algumas das funcionalidades disponibilizadas pelo dashboard desenvolvido ao site do DPRF estão: (i) gráficos diversos, os quais consideram características temporais, geográficas, condicionantes, gravidade e envolvidos; (ii) mapas interativos, que permitem visualizar acidentes por estado e rodovia; e (iii) pesquisa de acidentes por meio da combinação de determinados filtros, tais como município, estado, rodovia, data de ocorrência, etc., que serão apresentados nos resultados e discussões. Ao final deste artigo, ressalta-se a importância da lei de acesso à informação de 2011 e da disponibilização de dados abertos, assim como conclusões obtidas e direções para trabalhos futuros.

Dados abertos

Com a legislação sobre a transparência no setor público, o movimento de dados abertos vem crescendo no Brasil. Conforme Harrison et al. (2012), dados abertos colaboram para que haja um maior controle social, bem como o fortalecimento da democracia e da cidadania e uma melhora na administração pública. O desenvolvimento de ações de dados abertos, assim como a inovação e difusão de novos dispositivos digitais, permitem maior acessibilidade aos dados, bem como a facilidade de desenvolvimento de ferramentas de processamento, armazenamento, manipulação, análise e distribuição deste vasto volume de dados (Boulton, 2014; Boulton et al., 2011; Braunschweig et al., 2012). Além disso, o Tribunal de Contas da União (TCU, 2015) apresenta cinco principais motivos para a abertura de dados: (i) transparência na gestão pública; (ii) contribuição da sociedade com serviços inovadores ao cidadão; (iii) aprimoramento na qualidade dos dados governamentais; (iv) viabilização de novos negócios; e (v) obrigatoriedade por lei.

Informações governamentais e dados abertos, de acordo com Pinho e Silva (2019), diferem entre si no que se refere às exigências prévias, pois o padrão do formato aberto, elaborado por uma série de requisitos, coloca ênfase em dados brutos, formatados de modo que sejam facilmente trabalhados e analisados por terceiros. Assim, por um lado, dados abertos não são informações previamente interpretadas, mas usuários dos dados abertos podem acessar diretamente esses dados brutos e customizá-los de acordo com suas necessidades (Braunschweig et al., 2012). Por outro lado, geralmente informações governamentais são publicadas em formatos que dificultam o acesso e a sua utilização, impedindo que sejam combinadas e agregadas com outros dados (Diniz, 2010). Desta forma, estudos para elaborar mecanismos para a integração de dados são necessários, visando a sua interligação e reutilização, bem como estudos que tenham objetivo de explorar seu potencial econômico (Albano et al., 2019).

De acordo com o Portal Brasileiro de Dados Abertos (PBDA, 2020), os dados abertos são regidos por oito princípios, que são:

a) Completos: Todos os dados públicos são disponibilizados. Dados são informações eletronicamente gravadas, incluindo, mas não se limitando, documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são dados que não estão sujeitos às limitações válidas de privacidade, segurança ou controle de acesso, regulados por estatutos;

b) Primários: Os dados são publicados na forma coletada na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada;

c) Atuais: Os dados são disponibilizados tão rapidamente quanto necessário para preservar o seu valor;

d) Acessíveis: Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis;

e) Processáveis por máquina: Os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado;

f) Acesso não discriminatório: Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro;

g) Formatos não proprietários: Os dados estão disponíveis em um formato sobre o qual nenhum ente tenha controle exclusivo;

h) Livres de licenças: Os dados não estão sujeitos a regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas, desde que na forma regulada por estatutos.

Além destes, a Open Government Data (2007) elenca ainda sete princípios adicionais, os quais não estão incluídos nos princípios originais para dados abertos governamentais, mas que poderiam também ser considerados:

  1. On-line & gratuito: Os dados devem estar disponíveis na Internet e de forma gratuita, além de ser possível encontrá-los;

  2. Permanentes: Os dados devem estar disponíveis indefinidamente, em uma localização estável na Internet e em formato de dados estável pelo prazo mais longo possível;

  3. Confiável: O conteúdo publicado deveria ser assinado digitalmente ou incluir um atestado de data de publicação, autenticidade e integridade. Assinaturas digitais ajudam o público a validar a origem dos dados encontrados e a garantir que não tenham sido modificados desde a sua publicação;

  4. Presunção de abertura: A presunção de abertura se baseia em leis, como a Lei da Liberdade de Informação, procedimentos que incluem gerenciamento de registros e ferramentas como catálogos de dados. Definir o padrão como aberto significa que o governo e as partes que agem em seu nome disponibilizarão informações públicas de forma proativa e colocadas ao alcance do público (on-line);

  5. Documentado: Os sites do governo devem disponibilizar aos usuários informações suficientes, documentando o formato e significado dos dados, tornando-os úteis;

  6. Seguro para abrir: Os órgãos governamentais que publicam dados on-line sempre devem procurar publicar usando formatos de dados que não incluem conteúdo executável, visto que conteúdo executável dentro de documentos representa um risco de segurança para os usuários dos dados, porque pode se tratar de malware;

  7. Projetado com contribuição pública: O público está na melhor posição para determinar quais tecnologias de informação serão mais adequadas aos aplicativos que pretende criar para si mesmo. A contribuição do público é, portanto, crucial para disseminar as informações de maneira que tenham valor.

Estes princípios foram utilizados para analisar o portal de dados abertos do DPRF (2019a, 2019b), e o resultado de sua análise é apresentado em detalhes na próxima seção.

MATERIAL E MÉTODOS

Coleta e análise de dados

Conforme Gil (2017), esta pesquisa é considerada de natureza aplicada e de forma quantitativa, pois seus resultados são utilizados para solucionar problemas reais, procurando confirmar por meio de números conhecimentos gerados em sua aplicação. O conjunto de dados é referente a acidentes de trânsito em rodovias federais do Brasil no período de 2007 a 2019, obtido no site do DPRF (2019a). Neste conjunto de dados existem diversas variáveis, como causa do acidente, dia da semana da ocorrência, município de ocorrência, classificação, dentre outras. Maiores detalhes sobre as variáveis do banco de dados podem ser consultados em DPRF (2019b).

Considerando os 8 princípios citados na subseção anterior (PBDA, 2020), pode-se classificar o site do DPRF para cada um deles, conforme o Quadro 1.

F

Embora o site do DPRF atenda parcialmente aos 8 princípios dos dados abertos, ele não é muito útil para pesquisa de acidentes, pois os dados precisam ser processados para que se gere alguma informação. Por exemplo, se o usuário quiser saber qual foi a rodovia com maior número de acidentes em Santa Catarina (SC) no ano de 2018, esta informação não estará disponível, necessitando conhecimentos em alguma linguagem de programação para a agregação dos dados.

No Quadro 2 são apresentados os sete princípios adicionais analisados em relação ao site do DPRF para cada um deles.

F

Para melhorar o acesso a esse tipo de informação, foi utilizada uma abordagem de projeto de ciência de dados, utilizando a linguagem de programação R, descrita na próxima seção.

Projeto de ciência de dados

Um projeto típico de ciência de dados pode ser visto exemplificado na Figura 1. Este projeto foi desenvolvido utilizando a linguagem de programação R. O software R, que é um projeto open source, uma linguagem e um ambiente para computação estatística (R Core Team, 2020). Sua programação é feita mediante a digitação de linhas de comando, ou seja, os usuários que utilizam este programa devem ter algum tipo de conhecimento em linguagem de programação. Como nem todos possuem este conhecimento, uma alternativa é a utilização do pacote Shiny (Chang e Ribeiro, 2018), um framework para o desenvolvimento de aplicações em web. Com a utilização do Shiny é possível substituir a programação de funções em R em aplicações interativas na web. Além do Shiny, são descritos na figura mais alguns pacotes (atualmente, o R possui mais de 16.045) úteis para o projeto.

F

Descrição dos passos de um projeto de ciência de dados, segundo Wickham e Grolemund (2017):

  1. Definir o problema: A definição do problema ajuda a identificar quais dados necessitamos para responder às questões levantadas;

  2. Importar dados: A importação dos dados pode acontecer por acesso a um banco de dados, download de algum site da internet e/ou raspagem de dados da internet. Pacotes recomendados para software R: readr (Cooper, 2017), readxl (Wickham e Bryan, 2019), httr (Wickham, 2020) e dbi (Wickham e Müller, 2019);

  3. Arrumar os dados: Consiste em retirar inconsistências e normalizá-las. Pacote recomendado para software R: tidyr (Wickham e Henry, 2020);

  4. Transformar: Consiste em modificar os dados em tabelas, em que cada linha é uma observação e cada coluna uma variável. Nesta etapa acontece a transformação de dados brutos em informação. Pacotes recomendados para o software R: dplyr (Wickham et al., 2020b) e purrr (Henry e Wickham, 2020);

  5. Visualizar: Os quadros gerados na etapa anterior podem ser transformados em gráficos. Nesta etapa acontece a transformação de dados brutos em informação. Pacotes recomendados para o software R: ggplot2 (Wickham et al., 2020a) e plotly (Sievert et al., 2020);

  6. Modelar: Podem ser gerados modelos estatísticos que ajudem na produção de informação. Pacotes recomendados para o software R: broom (Robinson et al., 2020) e sweep (Dancho e Vaughan, 2019);

  7. Comunicar: Uma vez definidas quais informações são relevantes, ou seja, quais gráficos e tabelas mostrar, são produzidos os relatórios e/ou dashboards. Pacotes recomendados para o software R: rmarkdown (Allaire et al., 2020) e shiny (Chang et al., 2020).

Dessa forma, após as etapas do projeto de ciência de dados e seus respectivos pacotes para o software R, é possível desenvolver o dashboard ao site do DPRF, a fim de contribuir no tratamento da base de dados e no acesso às informações públicas.

RESULTADOS E DISCUSSÃO

Seguindo a metodologia descrita, incluindo as fases do projeto de ciência de dados, foi desenvolvido um dashboard ao site do DPRF, e sua base de dados pode ser vista na seguinte forma, conforme a Figura 2.

No site demonstrado na Figura 4 só existem os links para fazer o download dos dados dos acidentes. Se, por exemplo, houver a necessidade de fazer uma análise ao longo dos anos, é necessário fazer o download de todos os anos, abrir os arquivos compactados no formato .rar e utilizar algum programa para unir as tabelas, “limpar” os dados, transformar (fazer algum tipo de agregação). Somente assim é possível conseguir criar gráficos e fazer análises. Estes procedimentos estão muito distantes das pessoas, pois são conhecimentos específicos em computação e estatística. Neste sentido, foi desenvolvido um dashboard para auxiliar no acesso e na visualização dos dados, que pode ser acessado no seguinte link: https://r-nnq.shinyapps.io/_dashboard_.

F

No dashboard desenvolvido (Figuras 5 e 7-20) é possível realizar diferentes consultas. O menu lateral esquerdo possui algumas informações, como Pesquisa por acidente e Descrição das Rodovias. Ao selecionar “Pesquisa”, irá abrir elementos de filtro de busca, como: Escolha um estado; Escolha uma BR; Escolha faixa de Km; Filtre por data. Após realizar a seleção de cada elemento, deve-se ir em “Aplicar Pesquisa” (Figura 3).

O dashboard irá mostrar os dados estatísticos da consulta realizada: apresenta dados gerais de quantidade de acidentes, vítimas fatais, vítimas feridas e o estado/BR. As características da pesquisa são: mapa da rodovia, temporais, geográficas, condicionantes, gravidade e envolvidos.

F

Para mostrar as potencialidades do dashboard desenvolvido, o qual pode contribuir na tomada de decisão para implementação de políticas públicas, foram selecionadas a BR 101 e a BR 470, que cruzam o estado de Santa Catarina. Conforme o Departamento Nacional de Infraestrutura de Transportes (DNIT, 2020), a BR 101 é considerada uma rodovia longitudinal que corta o país na direção Norte-Sul, enquanto a BR 470 é considerada como uma rodovia de ligação, conectando rodovias federais, ou pelo menos uma rodovia federal a cidades ou pontos importantes. A BR 470, em Santa Catarina, envolve vários municípios em seu trecho, no qual estão concentrados polos industriais das mais diversas áreas, bem como porto e aeroporto, possibilitando assim o escoamento de seus produtos.

Em relação ao número de acidentes nestas duas rodovias, o estudo realizado por Peña et al. (2008) apresenta a evolução quanto ao número de acidentes, conforme Figura 4.

F

De acordo com os autores supracitados, a BR 101 tem uma diferença maior quanto ao número de acidentes em relação às demais rodovias no estado de Santa Catarina. Segundo Penã et al. (2008), a BR 470 se destaca pelo aumento crescente do número de acidentes por ano. No estudo realizado por Possamai (2017), no qual utilizou-se a base de dados do DPRF, identificou-se 13.270 acidentes na BR 470 em Santa Catarina no período de 2012 a 2017. O autor caracterizou a referida rodovia como sendo a de maior morbimortalidade por quilômetro de rodovia. Desta forma se justifica a escolha destas duas rodovias.

A seguir, apresentamos algumas consultas realizadas no dashboard que podem contribuir na tomada de decisão para implementação de políticas públicas.

(i) Em qual mês do ano ocorrem mais acidentes em determinada rodovia?

Essa é uma questão que o público em geral, ao entrar no dashboard, poderá encontrar a resposta por meio da visualização dos gráficos. A consulta para descobrir em qual mês do ano ocorrem mais acidentes em determinada rodovia requer alguns passos e filtros. Neste caso, escolhe-se o estado de Santa Catarina, a BR 101, e o período de 01 de janeiro de 2007 a 31 de dezembro de 2019. Então, deve-se pressionar “aplicar pesquisa” e aparecerá o “Mapa dos Acidentes” e as características: temporais, geográficas, condicionantes, gravidade e envolvidos. Nesta consulta, selecionamos a característica “temporais” e a variável “mês do ano” (Figura 5). Realiza-se o mesmo procedimento para a consulta da BR 470 (Figura 6).

F

Assim, rapidamente podemos descobrir qual mês apresenta o maior número de acidentes. Percebe-se que os meses de dezembro (BR 101: 9.247 e BR 470: 3.252) e janeiro (BR 101: 8.919) têm maior número de acidentes. Esse crescimento do número de acidentes neste período pode estar relacionado ao recesso de fim de ano. A BR 101 corta o litoral de SC e a BR 470 é uma das que conecta as cidades do interior ao litoral do estado. Dessa forma, o fluxo de veículos vindo de diversas partes do país para o estado, como também dentro do próprio estado, é maior que o tráfego durante os outros meses do ano. Uma das características do estado de SC é o turismo, que nesses períodos de veraneio recebe muitos visitantes. De acordo com o portal de notícias do governo de Santa Catarina, a temporada 2019/2020 teve uma expectativa de 5 milhões de turistas. Essas informações são relevantes para pensar em diferentes estratégias para segurança pública e, consequentemente, a diminuição de acidentes rodoviários (para mais informações, consultar Gorges (2019)).

(ii) Em quais trechos de determinada rodovia ocorrem mais acidentes?

Para verificar quais são os trechos em que ocorrem mais acidentes, o mapa já nos revela algumas informações. No entanto, podemos realizar a consulta por municípios e Km. O procedimento é o mesmo realizado no tópico anterior, porém, a característica que selecionamos é a “geográfica”, e a variável escolhida é por “município”, e em seguida, na nova consulta, a variável escolhida é por “Km”.

A Figura 7 ilustra a quantidade de acidentes em cada trecho da BR 101 no período de 2007 a 2019, e visualmente podemos verificar que a maior concentração de acidentes é no trecho que corresponde à Grande Florianópolis, ou seja, do quilômetro 200 ao 220. Esse dado é corroborado com a Figura 8, ao verificarmos os acidentes por município, sendo São José com 17.428 acidentes, seguido de Palhoça, com 11.499 acidentes.

F

A Figura 9 ilustra a quantidade de acidentes em cada trecho da BR 470 no período de 2007 a 2019, e visualmente podemos verificar o trecho de maior concentração de acidentes, que corresponde à região do Médio Vale do Itajaí, do quilômetro 40 ao 60. Podemos confirmar esses dados ao verificar os acidentes por município, de acordo com a Figura 10. Liderando a quantidade de acidentes está Blumenau, com 7.610 acidentes, seguido de Indaial, com 4.664 acidentes.

F

Dessa forma, os locais com maior frequência de acidentes rodoviários podem estar relacionados a diversas causas, como: maior fluxo de veículos por serem regiões metropolitanas (cidades centrais que influenciam as demais econômica, social e politicamente), falta de sinalização, quantidade de acessos, entre outros.

(iii) Como é a distribuição dos acidentes em determinada rodovia, considerando o tipo de pista (simples, dupla, múltipla)?

Para identificar o tipo de pista em que ocorre o maior número de acidentes, na consulta deve-se selecionar a característica “geográfica” e a variável “tipo de pista”. Esse passo a passo deve ser realizado tanto na BR 101 quanto na BR 470. Podemos verificar (Figura 11) que na BR 101 a maioria dos acidentes ocorre em pista dupla (66.51%). Já na BR 470, a grande maioria dos acidentes ocorre em pista simples, correspondendo a 98.7%.

F

Cabe destacar que a realidade das duas BRs é diferente: a BR 101, no estado de SC, passou por um processo de duplicação, porém, atualmente o seu percurso no estado é totalmente duplicado, enquanto que a BR 470, em sua maior parte, é de pista simples, e atualmente há um trecho que está em processo de duplicação (entre os municípios de Navegantes e Indaial, aproximadamente 70 quilômetros; para mais informações, consultar Vieira (2020)), porém, há tensões e entraves econômicos e políticos que impedem o avanço das obras.

(iv) Como é a distribuição dos acidentes em determinada rodovia, considerando a gravidade (sem vítimas, com vítimas feridas, com vítimas fatais)?

Em relação à gravidade dos acidentes rodoviários, é possível verificar ao selecionar a característica “gravidade” (Figura 12). Realizamos o mesmo procedimento para a BR 101 e para a BR 470, e mesmo as BRs possuindo características particulares, verificamos semelhanças. Um pouco mais da metade dos acidentes é sem vítimas (BR 101, com 53.16%, e BR 470, com 50.34%), seguido de acidentes com vítimas feridas (BR 101, com 44.11%, e BR 470, com 45.96%) e em terceiro estão as vítimas fatais (BR 101, com 2.17%, e BR 470, com 3.34%).

F

Uma das hipóteses que podemos pensar para esse número de acidentes sem vítimas são as políticas públicas de segurança e preservação da vida, por meio de políticas de conscientização no trânsito. Dentre as medidas cabe destacar a Resolução n° 277/2008 do Conselho Nacional de Trânsito (CONTRAN, 2008), conhecida como “lei da cadeirinha”, e a Lei nº 11.705/2008, conhecida como “lei seca”, que entraram em vigor em 2008; a Lei n° 12.760/2012, que institui o aumento no valor da multa, uma vez que a lei seca não teve eficácia, ou seja uma redução de acidentes envolvendo embriaguez (Brasil, 2012); a Lei n° 12.971/2014, que aumenta a punição referente às ultrapassagens indevidas e aos comportamentos indevidos; e a Lei n° 13.821/2016, na qual os valores das multas de todas as infrações de trânsito foram modificadas, tendo um acréscimo superior a 50% (Brasil, 2014;2016).

(v) Quais são as principais causas de acidentes em determinada rodovia?

Para identificar quais são as causas dos acidentes mais frequentes, o procedimento é o mesmo realizado até agora, porém, a característica a ser selecionada é a “condicionante” e a variável escolhida é “causa do acidente”. Em seguida, na nova consulta deve-se mudar a variável para “tipo de acidente”. Realizamos essa sequência tanto na BR 101 quanto na BR 470.

Ao analisar a BR 101, podemos observar na Figura 13 que as quatro maiores causas de acidentes são: falta de atenção à condução (43.417 acidentes), outras (14.511 acidentes), não guardar distância de segurança (10.061 acidentes) e velocidade incompatível (5.879 acidentes). Em relação ao tipo de acidente (Figura 14), cabe destacar: em primeiro lugar estão as colisões traseiras (29.527 acidentes), seguido de colisões laterais (16.470 acidentes).

F

Seguindo a análise da BR 470, podemos observar na Figura 15 que as quatro maiores causas de acidentes são: falta de atenção à condução (15.086 acidentes), outras (3.696 acidentes), não guardar distância de segurança (3.584 acidentes) e velocidade incompatível (3.419 acidentes). Em relação ao tipo de acidente (Figura 16), cabe destacar: em primeiro lugar estão colisões traseiras (8.988 acidentes), em segundo lugar colisões transversais (8.587 acidentes), seguido de colisões laterais (5.177 acidentes).

F

Nas duas rodovias, a falta de atenção na condução é a principal causa dos acidentes rodoviários. Podemos correlacionar ao maior tipo de acidente − a colisão traseira. Estudos da Organização Pan-Americana da Saúde (OPAS, 2019, n.p.) revelam que a “distração causada por celulares é uma preocupação crescente para a segurança no trânsito”. Outro aspecto é o aumento no número de acidentes. Os condutores que usam o celular ao volante “têm cerca de 4 vezes mais chances de estarem envolvidos em um acidente” (OPAS, 2019, n.p.).

(vi) Qual é a faixa de idade mais comum das pessoas envolvidas em acidentes em determinado estado?

Para finalizar nossas análises e mostrar o potencial do dashboard para as políticas públicas, apresentamos o gráfico a respeito da faixa etária dos envolvidos nos acidentes. Os procedimentos de busca são os mesmos aplicados anteriormente, apenas mudamos a característica dos acidentes para “envolvidos” e a variável que selecionamos foi “idade das pessoas” (Figura 17 e Figura 18).

F

Podemos observar tanto na BR 101 (Figura 17) quanto na BR 470 (Figura 18) que a faixa etária dos envolvidos está entre 25 e 30 anos, correspondendo a 28.270 e 10.451 acidentes, respectivamente. Segundo Albertini et al. (2020, p. 2.800), os acidentes de transporte terrestre no Brasil configuram um problema de saúde pública e é “a principal causa de morte de adultos jovens entre 20 e 29 anos, sobretudo os do sexo masculino”. Os autores reconheceram um padrão das características epidemiológicas e o perfil das vítimas dos acidentes de trânsito: “segundo o DATASUS, 82,38% das vítimas de acidentes fatais são homens e 17,62% são mulheres; a maior parte dessas vítimas são adultos jovens, com idade entre 20 e 49 anos e proprietários de motocicletas” (Albertini et al., 2020, p. 2.802).

Nesta seção foram apresentadas algumas das funcionalidades do dashboard para o acesso à informação de dados públicos relacionados ao cotidiano da população, pois irão refletir em políticas públicas, desde conscientização e educação para o trânsito até a implementação de melhorias de acesso às BRs e a sinalização, entre outros aspectos.

CONCLUSÃO

A Lei de acesso à informação de 2011 foi importante para obrigar os entes públicos e as entidades privadas sem fins lucrativos a darem publicidade aos seus dados. A lei abrange os órgãos e entidades federais, estaduais, distritais e municipais, dos Poderes Executivo, Legislativo e Judiciário. Um destes dados é o de acidentes nas rodovias federais no Brasil, disponibilizado pelo site do DPRF, que foi tema de análise neste trabalho.

Foi avaliado como os dados do site do DPRF estão disponibilizados e se seguem os oito princípios sugeridos pelo Portal Brasileiro de Dados Abertos (PBDA, 2020), sendo eles: completo, primário, atual, acessível, processável por máquina, acesso não discriminatório, formato não proprietário e livres de licenças. Constatou-se que seguem parcialmente os princípios, principalmente por não atenderem ao formato não proprietário (os arquivos são compactados no formato .rar) e devido aos dados serem atualizados a cada 3 meses. Estas observações devem ser informadas à área de TICs do órgão para melhor adequação aos princípios que regem os dados abertos. Em relação aos sete princípios adicionais sugeridos pela Open Government Data (OGD, 2007): on-line & gratuito; permanentes; confiável; presunção de abertura; documentado; seguro para abrir; e projetado com contribuição pública, verificou-se que o site do DPRF satisfaz 5 desses, sendo que o princípio “Confiável” e o “Projetado com contribuição pública” não são atendidos.

Depois, utilizou-se uma metodologia de projeto de ciência de dados para a construção de um dashboard informativo, utilizando o software R (que é open source). Este dashboard tem o objetivo melhorar o acesso à informação sobre acidentes em rodovias federais no Brasil.

No exemplo da utilização pelo usuário do dashboard, foi selecionado o estado de SC e as BRs 101 e 470. Como resultado, pode-se verificar que a concentração dos acidentes é nas regiões metropolitanas. Destarte, surgem os seguintes questionamentos: há falta de sinalização na rodovia federal nestes percursos? São os vários acessos à cidade? É o intenso fluxo de veículos? São questionamentos que a partir da utilização do dashboard podem contribuir com as diferentes esferas do poder público, visando a melhoria e segurança da população. Assim, os questionamentos dessa temática são inúmeros, porém, utilizar os dados públicos abertos para melhoria do bem-estar social da sociedade é um direito.

Para trabalhos futuros, sugere-se um modelo de previsão de acidentes de acordo com os dados abertos disponibilizados pelo DPRF. Esses modelos podem contribuir em políticas de administração pública, pois a partir das métricas e das estatísticas gerais poderão ser verificados os focos de maior vulnerabilidade, ou seja, as causas e os locais de maior concentração de acidentes.

REFERÊNCIAS

Albano, C.S., Leaes Júnior., W. & Corso, K.B. (2019), “Dados abertos: um estudo em trabalhos acadêmicos no contexto brasileiro”, Navus, vol. 9, no. 2, pp. 135-47.

Albertini, A.B.N., Garcia, T.V., Paulo, L.G., Toledo, E.R.S., Charlo, P.B. & Silva, M. (2020), “Caracterização epidemiológica e sociodemográfica de acidentes de trânsito: uma revisão integrativa da literatura”, Saúde Coletiva (Barueri), vol. 10, no. 55, pp. 2797-814.

Allaire, J.J., Xie, Y., McPherson, J., Luraschi, J., Ushey, K., Atkins, A., Wickham, H., Cheng, J., Chang, W. & Iannone, R. (2020), Rmarkdown: Dynamic Documents for R, version 2.1, R-Packages, disponível em: https://cran.r-project.org/web/packages/rmarkdown/index.html (acesso em 10 jan. 2020).

Attard, J., Orlandi, F., Scerri, S. & Auer, S. (2015), “A systematic review of open government data initiatives”, Government Information Quarterly, vol. 32, no. 4, pp. 399-418.

Boulton, G. (2014), “The open data imperative”, Insights, vol. 27, no. 2, pp. 133–8.

Boulton, G., Rawlins, M., Vallance, P. & Walport, M. (2011), “Science as a public enterprise: The case for open data”, The Lancet, vol. 377, no. 9778, pp. 1633–5.

Brasil (2011), Lei Ordinária n. 12.527, de 18 de novembro de 2011, Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal; altera a Lei nº 8.112, de 11 de dezembro de 1990; revoga a Lei n. 11.111, de 5 de maio de 2005, e dispositivos da Lei n. 8.159, de 8 de janeiro de 1991; e dá outras providências, Presidência da República, Brasília, DF.

Brasil (2012), Lei nº 12.760, de 20 de dezembro de 2012, altera a Lei nº 9.503, de 23 de setembro de 1997, que institui o Código de Trânsito Brasileiro, Presidência da República, Brasília, DF.

Brasil (2014), Lei nº 12.971, de 9 de maio de 2014, Altera os artigos 173, 174, 175, 191, 202, 203, 292, 302, 303, 306 e 308 da Lei nº 9.503, de 23 de setembro de 1997, que institui o Código de Trânsito Brasileiro, para dispor sobre sanções administrativas e crimes de trânsito. Presidência da República, Brasília, DF.

Brasil (2016), Lei nº 13.281, de 4 de maio de 2016, Altera a Lei nº 9.503, de 23 de setembro de 1997 (Código de Trânsito Brasileiro), e a Lei nº 13.146, de 6 de julho de 2015. Presidência da República, Brasília, DF.

Braunschweig, K., Eberius, J., Thiele, M., Lehner, W. & Dresden, T.U. (2012), “The state of open data. limits of current open data platforms”, artigo apresentado no WWWC 2012: World Wide Web Conference, Lyon, France, 21 de abr. 2012.

Chang, W. & Ribeiro, B.B. (2018), “Shiny_dashboard_: Create dashboard_s with ‘Shiny’. R package version 0.7.1.”, disponível em: https://CRAN.R-project.org/package=shiny_dashboard (acesso em: jun. 2020).

Chang, W., Cheng, Allaire, J.J., Sievert, C., Schloerke, B., Xie, Y., Allen, J., McPherson, J., Dipert, A., Borges, B. (2020), shiny: Web Application Framework for R, version 1.4.0.2., R-Packages, disponível em: https://cran.r-project.org/web/packages/shiny/index.html (acesso em: 13 jun. 2019).

Cooper, N. (2017), Reader: Suite of Functions to Flexibly Read Data from Files, version 1.0.6.2, R-Packages, disponível em: https://cran.r-project.org/web/packages/reader/index.html (acesso em: 10 dez. 2019).

Dancho, M. & Vaughan, D. (2020), sweep: Tidy Tools for Forecasting, disponível em: https://cran.r-project.org/web/packages/sweep/index.html (acesso em: 10 dez. 2019).

Departamento de Polícia Rodoviária Federal (2019a), Dados Abertos, disponível em: https://www.prf.gov.br/portal/dados-abertos (acesso em: 06 dez. 2019).

Departamento de Polícia Rodoviária Federal (2019b), Dicionário de Variáveis – por ocorrência, disponível em: https://www.prf.gov.br/portal/dados-abertos/acidentes/icionário-de-variaveis-por-ocorrencia (acesso em: 06 dez. 2019).

Departamento Nacional de Infraestrutura de Transportes (2020), Nomenclatura das Rodovias Federais, disponível em https://www.gov.br/dnit/pt-br/rodovias/rodovias-federais/nomeclatura-das-rodovias-federais (acesso em: 10 nov. 2020).

Diniz, V. (2010), “Como conseguir dados governamentais abertos”, artigo apresentado no III Congresso CONSAD de Gestão Pública, Brasília, DF, 15-17 mar. 2010.

Gil, A.C. (2017), Como elaborar projetos de pesquisa, 4a ed., Atlas, São Paulo.

Gorges, L. (2019), Verão Santa Catarina 2019/2020 mobiliza 9,2 mil profissionais da segurança e prevê investimento de R$ 41,1 milhões, Agência Catarinense de Notíciais, Florianópolis, SC, disponível em: https://www.sc.gov.br/noticias/temas/verao-santa-catarina/verao-santa-catarina-2019-2020-mobiliza-9-2-mil-profissionais-da-seguranca-e-preve-investimento-de-41-1-milhoes (acesso em: 30 out. 2020).

Governo do Brasil (2020), Brasil registra queda em número de mortes no trânsito, Governo do Brasil, Brasília, DF, disponível em https://www.gov.br/pt-br/noticias/transito-e-transportes/2020/09/brasil-registra-queda-em-numero-de-mortes-no-transito (acesso em: 05 nov. 2020).

Harrison, T. M., Harrison, T.M., Guerrero, S., Burke, G.B., Cook, M.E., Cresswell, A.M., Helbig, N., Hrdinová, J., & Pardo, T.A. (2012), “Open government and e-government: democratic challenges from a public value perspective”, Information Polity, vol. 17, no. 2, pp. 83-97.

Henry, L. & Wickham, H. (2020), purrr: Functional Programming Tools, version 0.3.3., R-Packages, disponível em: https://cran.r-project.org/web/packages/purrr/index.html (acesso em: 03 mai. 2020).

Instituto de Pesquisa Econômica Aplicada (2015), Acidentes de Trânsito nas rodovias federais brasileiras: caracterização, tendências e custos para a sociedade, Ipea, Brasília, disponível em: http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=26277 (acesso em: 15 jun. 2020).

Open Government Data (2007), The 8 Principles of Open Government Data, Sebastopol, California, disponível em: https://opengovdata.org/ (acesso em: 17 jul. 2020).

Open Government Partnership (2011), Declaração de Governo Aberto, disponível em: http://www.governoaberto.cgu.gov.br/central-de-conteudo/documentos/arquivos/declaracao-governo-aberto.pdf (acesso em: 16 jul. 2020).

Open Knowledge Foundation (2020), What is Open Data?, Open Knowledge Foundation, disponível em: http://opendatahandbook.org/guide/en/what-is-open-data/ (acesso em 15 jul. 2020).

Organização Pan-Americana da Saúde (2019), Folha informativa - Acidentes de trânsito, Organização Pan-Americana da Saúde, disponível em: https://www.paho.org/bra/index.php?option=com_content&view=article&id=5147:acidentes-de-transito-folha-informativa&Itemid=779 (acesso em: 01 out. 2020).

Peña, C.C., Tani, V., Kaesemodel, L., Otto, G.G., Wutke, J.D. & Andrade, R.F. (2008), Identificação dos segmentos críticos das Rodovias Federais de Santa Catarina, Departamento Nacional de Infraestrutura de Transportes, Universidade Federal de Santa Catarina, Florianópolis, SC.

Pinho, M.D.C. & Silva, M.P.A. (2019), “Governo aberto e dados abertos governamentais: um mapeamento e sistematização da produção acadêmica”, Comunicação & Inovação, vol. 20, no. 43, pp. 3-25.

Portal Brasileiro de Dados Abertos (2020), O que são dados abertos?, Portal Brasileiro de Dados Abertos, disponível em: http://dados.gov.br/pagina/dados-abertos (acesso em: 29 mai. 2020).

Possamai, C.A.P. (2017), Estudos de pontos críticos de acidentes de trânsito nas Rodovias Federais de Santa Catarina e melhorias viárias de baixo custo, Monografia de Especialização em Perícia de Acidentes de Trânsito, Instituto Federal de Santa Catarina, Florianópolis, SC.

R Core Team (2020), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, disponível em: http://www.R-project.org/ (acesso em: 03 jan. 2020).

Robinson, D., Hayes, A., Couch, S., Psit Software, Patil, I., Chiu, D., Gomez, M., Demeshev, B., Menne, D., Nutter, B., Johnston, L., Bolker, B., Briatte, F., Arnold, J., Gabry, J., Selzer, L., Simpson, G., Preusser, J., Hesselberth, J. & Wickham, H. (2020), broom: Convert Statistical Analysis Objects into Tidy Tibbles, version 0.5.5., R-Packages, disponível em: https://cran.r-project.org/web/packages/broom/index.html (acesso em: 05 jan. 2020).

Sievert, C., Parmer, C., Hocking, T., Chamberlain, S., Ram, K., Corvellec, M., Despouy, P., Bruggemam, S., Inc, P.T. (2020), plotly: Create Interactive Web Graphics via 'plotly.js', version 4.9.2.1, R-Packages, disponível em: https://cran.r-project.org/web/packages/plotly/index.html (acesso em: 02 abr. 2020).

Silva, C.F., Santos, E.M.F., Chaves, M.C., Vaz, W. & Balaniuk, R. (2014), “Dados abertos: uma estratégia para o aumento da transparência e modernização da gestão pública”, Revista TCU, vol. 131, pp. 22-9.

Tischer, V. (2019), “O custo social e econômico dos acidentes de trânsito com pedestres e ciclistas: estudo de caso do estado de Santa Catarina, Brasil”, Revista Brasileira de Gestão Urbana, vol. 11, pp. 1-14.

Tribunal de Contas da União (2015), Cinco motivos para a abertura de dados na administração pública?, TCU, Brasília, disponível em: https://portal.tcu.gov.br/biblioteca-digital/cinco-motivos-para-a-abertura-de-dados-na-administracao-publica.htm (acesso em: 17 jul. 2020).

Veljković, N., Bogdanović-Dinić, S. & Stoimenov, L. (2014), “Benchmarking open government: An open data perspective”, Government Information Quarterly, vol. 31, no. 2, pp. 278-90.

Vieira, R. (2020), A rodovia do Vale: Trevo do Badenfurt é novo desafio da duplicação da BR-470 em SC, disponível em: https://ndmais.com.br/economia-sc/a-rodovia-do-vale-trevo-do-badenfurt-e-novo-desafio-da-duplicacao-da-br-470-em-sc/ (acesso em: 02 dez. 2020).

Wickham, H. & Bryan, J. (2019), Readxl: Read Excel Files, version 1.3.1, R-Packages, disponível em: https://cran.r-project.org/web/packages/readxl/index.html (acesso em 12 nov. 2020).

Wickham, H. & Grolemund, G. (2017), R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O’Reilly Media, Gravenstein Highway North, Sebastopol, CA.

Wickham, H. & Henry, L. (2020), tidyr: Tidy Messy Data, version 1.0.2, R-Packages, disponível em: https://cran.r-project.org/web/packages/tidyr/index.html (acesso em: 19 fev. 2020).

Wickham, H. & Müller, K. (2019), DBI: R Database Interface, version 1.1.0, R-Packages, disponível em: https://cran.r-project.org/web/packages/DBI/index.html (acesso em: 18 nov. 2019).

Wickham, H. (2020), hhtrs: Tools for Working with URLs and HTTP, version 1.4.1, R-Packages, disponível em: https://cran.r-project.org/web/packages/httr/index.html (acesso em: 13 nov. 2019).

Wickham, H., Chang, W., Henry, L., Pedersen, T.L., Takahashi, K., Wilke, C. Woo, K., Yutani, H. & Dunnington, D. (2020a), ggplot2: Create Elegant Data Visualisations Using the Grammar of Graphics, version 3.3.0, disponível em: https://cran.r-project.org/web/packages/ggplot2/index.html (acesso em: 25 mar. 2020).

Wickham, H., François, R., Henry, L., Müller, K. & Vaughan, D. (2020b), dplyr: A Grammar of Data Manipulation, version 0.8.5, disponível em: https://cran.r-project.org/web/packages/dplyr/index.html (acesso em: 20 mar. 2020).

World Health Organization (2018). Global status report on road safety 2018, World Health Organization, Genebra.


Recebido: 22 fev. 2021

Aprovado: 5 jun. 2023

DOI: 10.20985/1980-5160.2023.v18n1.1706

Como citar: Miranda, R.G., Konrath, A.C., Zatelli, M.R., Hoffmann, Y.T., Silva, S.A. (2023). Um dashboard para tomada de decisão considerando dados abertos de rodovias federais. Revista S&G 18, 1. https://revistasg.emnuvens.com.br/sg/article/view/1706