Visualização #1 – Nomes

Visualização criada a partir da lista de nomes obtida através do serviço informacaoDeputado, opcao MP: http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=MP

Publicado em Notícias | Tags | Publicar um comentário

Como usar o serviço informacaoDeputado

Por enquanto o serviço informacaoDeputado está disponivel em http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php e permite obter ficheiros CSV com a informação que é disponibilizada no site da Assembleia da República na página referente à biografia dos deputados.

Para conseguirem executar os exemplos seguintes têm que me contactar para eu vos fornecer uma chave de acesso.

Para já temos 5 opções principais:

  • MP – informação base sobre os deputados
  • Caucus – indicação de todas as legislaturas a que um deputado pertenceu
  • CaucusInfo – ids das legislaturas. necessario para saber o que colocar em alguns filtros
  • FactsType – tipos de factos disponiveis. necessario para saber o que colocar em alguns filtros
  • Facts – informação base sobre os “factos” dos deputados

CaucusInfo

  • devolve os ids das legislaturas e as datas de vigência
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=CaucusInfo

FactsType

  • devolve os nomes dos tipos de factos que podemos usar
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=FactsType

MP

  • devolve a informação base do deputado, id, nome, data de nascimento, profissão
  • Filtros: legislatura – se não quisermos todos os deputados podemos indicar a legislatura que pretendemos
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=MP
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=MP&legislatura=XI

Caucus

  • devolve a informação das legislaturas a que um deputado pertenceu: id, id legislatura, data legislatura, distrito pelo qual concorreu, partido pelo qual concorreu, indicação se tem informação de actividade e de registo de interesses
  • Filtros: legislatura – se não quisermos todos os deputados podemos indicar a legislatura que pretendemos
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=Caucus
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=Caucus&legislatura=XI

Facts

  • os factos representam a informação dos deputados, por exemplo habilitações literárias
  • Filtros: legislatura – se não quisermos todos os deputados podemos indicar a legislatura que pretendemos; mpid – se não quisermos a informação de todos os deputados
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=Facts
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=Facts&legislatura=I
  • http://www.oportoemconversa.com/datagovpt/informacaoDeputado.php?key=aTuaChave&opcao=Facts&legislatura=I&mpid=18

Publicado em Recursos | Tags , , , , | 4 Comentários

Perguntas a que dar resposta

Na sessão #1 e no post do Vítor já foram alinhavadas algumas ideias relativamente a possíveis queries aos dados que vão sendo recolhidos. Aqui ficam sistematizadas por natureza.

Composição da AR e Grupos parlamentares nas várias legislaturas

  • perspectivas: no geral; numa determinada legislatura; ao longo do tempo (evolução)
  • elementos a observar: idade, género, profissão, exclusividade, assiduidade

Actividade dos Deputados e dos Grupos Parlamentares

  • exclusividade
  • assiduidade
  • ligação ao círculo eleitoral (origem/ círculo)
  • dinamismo (nº de iniciativas e intervenções)
  • incidência territorial das iniciativas (quais as regiões/ distritos mais visados pelos deputados e grupos?)
  • relação dos grupos à natureza das iniciativas (ambiente, economia, agricultura e pescas, etc.)
  • relação dos grupos às votações
Publicado em Questões a formular | Publicar um comentário

Estatísticas da AR

Está presentemente em destaque o pdf com as estatísticas da actividade legislativa e parlamentar de Outubro de 2009 a Julho de 2010. Nela figuram dados que interessam para o nosso trabalho de levantamento. Aliás, confirmam-se as tendências já vislumbradas na tagcloud criada pela Ana ao nível das profissões mais presentes na a.r.

É verdade que não se trata de duplicação de informação, porque nós percorremos todas as legislaturas e estas estatísticas são dados de um determinado período de tempo. Além disso, tive o cuidado de verificar a regularidade com que se fazem e publicam estes dados e concluí rapidamente que é aleatório esporádico. Na pesquisa procurei o texto exacto “estatísticas da actividade” e só me foram devolvidos 4 resultados, entre eles 2 relevantes: um referente à 1ª sessão legislativa da XI Legislatura (em curso) e um relativo à 3ª sessão legislativa da X Legislatura.
Os URLs desses documentos têm o seu path em:

  • http://www.parlamento.pt/ActividadeParlamentar/Documents/Estatisticas_Actividade_Parlamentar_XILeg/ActividadeLegislativa_XI_1_vf.pdf
  • http://www.parlamento.pt/ActividadeParlamentar/Documents/Estatitsticas_Actividade_Parlamentar_XLeg/20090714_ActividadeLegislativa_X_3.pdf

o que me leva a crer que a haver mais estatísticas estariam em http://www.parlamento.pt/ActividadeParlamentar/Documents/Estatisticas_Actividade_Parlamentar, mas o acesso é negado.

Analisando a informação contida nesses documentos, existe uma secção relativa à composição da Assembleia em termos de idade, género e profissão, e depois segue-se a análise da actividade, mas em termos globais, não por deputado como é nossa intenção apurar. Porém, estes elementos podem ajudar-nos a definir com mais discernimento o que incluir no nosso trabalho de recolha e como criar as perguntas à BD.

Publicado em Notícias | Tags | Publicar um comentário

Hackday – sessão #1

A primeira sessão de trabalho do hackday transparencia serviu para partilhar algumas coisas que cada um de nós já tinhamos feito e perceber de que forma nos podemos integrar nos diferentes projectos possíveis.

Neste momento há dois caminhos a ser explorados, ambos a partir da informação disponivel online no site da assembleia da republica.

O primeiro tem como objectivo disponibilizar de uma forma mais interessante os dados do Diario da Assembleia da Republica. Para quem não conhece este diário tem a transcrição de tudo quanto é dito na AR.
A ideia é disponibilizar esses dados num formato não proprietário e acrescentar uma camada de informação que permita responder a perguntas como o que disse o deputado xxx sobre o tema yyy.
Claro que depois se podem construir também algumas coisas giras como o medidor de muito bens (sim essas afirmações também estão nesse diário da assembleia da republica).

O segundo tem como objectivo permitir explorar a informação dos deputados e suas actividades, informação essa que está nestas páginas.
Neste momento embora essa informação esteja toda online não existe nenhum interface que permita responder a questões como:
- qual o deputado com mais intervenções?
- como tem evoluido a representação das profissões ao longo das legislaturas, ou seja, provavelmente achamos que a a.r. é essencialmente constituida por pessoas ligadas à advocacia e similares mas será que é mesmo assim, e como tem variado?
- qual a legislatura com a idade média dos deputados mais alta? como tem variado? será que neste orgão também se nota aquilo que se diz de as novas gerações não estarem interessadas na participação pública?

O ricardo que está a trabalhar no primeiro projecto já desenvolveu um script que descarrega um diário, converte-o de pdf para txt e “anota-o” com alguma informação especifica para percebermos por exemplo onde estão os nomes dos deputados.
Falta-nos perceber ainda de que forma e que tipo de anotações vale a pena incluir nesse txt e se o convertemos para outro formato e claro saber depois como exploramos essa informação.
Uma ideia interessante seria por exemplo ter uma coisa parecida com o verbatim para explorar as citações dos deputados.
Esta área da exploração de texto livre é bastante desconhecida para mim que estou mais habituado a dados mais sistematizados como tabelas relacionais e afins por isso se quiserem contribuir com ideias estão à vontade.

Eu e a claudia estivemos a trabalhar no segundo projecto principalmente na parte da extracção de dados do site da a.r. Fizemos um pequeno scraper que aproveita o facto de as páginas da a.r. estarem construidas de tal forma que nem precisamos de nos perder em regular expressions e afins.
É um script bem comportado que faz propositadamente um número reduzido de pedidos por minuto e que extrai essa informação uma base de dados MySQL.
O objectivo é criar algo (feeds ou outros) que permita que outras equipas trabalhem essa informação.
Ficou a ideia de explorar o yahoo pipes para tentar fazer o mesmo processo de uma forma mais simples.

O tiago e o victor estiveram a ver como se poderia utilizar plugins drupal para explorar a informação dos deputados do segundo projecto. A ideia é reinventar o menos possivel.

A ana para além de criar o blog esteve também a fazer umas primeiras experiências com os dados que já extraimos dos deputados. Para isso criou uma tagcloud com as profissões indicadas dos deputados. Percebemos que vamos ter que ter algum processo de limpeza ou normalização da própria informação para evitar por exemplo situações de profissões que aparecem em duplicado por causa da forma como estão escritas.

Publicado em Sessões | Tags | 1 Comentário