Skip to content

Dados sobre Mortalidade (SIM)

Fluxo para os dados de Mortalidade do SIM

Extract

O processador utilizado será responsável por fazer a requisição para o site que hospeda os arquivos CSV com os dados do SIM, sistema de informações sobre mortalidade, do SUS.

O nome deste processador é InvokeHTTP, e nas suas configurações basta alterar a HTTP URL para o link da fonte de dados: https://diaad.s3.sa-east-1.amazonaws.com/sim/Mortalidade_Geral_2020.csv

Transform

Em seguida, o processador SplitRecords é utilizado para fazer a conversão dos dados de CSV para JSON. O mesmo processador utilizado no processo para o CID pode ser copiado e utilizado novamente.

Diferentemente do processo do CID, no processo para os dados sobre mortalidade serão geradas três tabelas, conforme documentado no DER, portanto a saída será redirecionada para três processadores, com auxílio da ferramenta Funnel, conforme ilustra a figura:

Cada script será responsável pela transformação dos dados relativos a uma das tabelas.

Metadados Sistema

Constam na tabela principal alguns dados de controle do sistema, portanto, foi criada uma nova entidade para armazenar esses dados.

fisico.sql

O script responsável por fazer esse tratamento é:

format_metadados.py

Investigação

O mesmo vale para os dados de investigação.

fisico.sql

O script responsável por fazer esse tratamento é:

sim_format_investigacao.py

Pessoa Falecida

O mesmo vale para os dados de pessoa falecida.

fisico.sql

O script responsável por fazer esse tratamento é:

sim_format_dados_pessoa_falecida.py

Óbito

O mesmo vale para os dados de óbito.

fisico.sql

O script responsável por fazer esse tratamento é:

sim_format_obito.py