Dados sobre Mortalidade (SIM)
Fluxo para os dados de Mortalidade do SIM
Extract
O processador utilizado será responsável por fazer a requisição para o site que hospeda os arquivos CSV com os dados do SIM, sistema de informações sobre mortalidade, do SUS.
O nome deste processador é InvokeHTTP, e nas suas configurações basta alterar a HTTP URL para o link da fonte de dados: https://diaad.s3.sa-east-1.amazonaws.com/sim/Mortalidade_Geral_2020.csv
Transform
Em seguida, o processador SplitRecords é utilizado para fazer a conversão dos dados de CSV para JSON. O mesmo processador utilizado no processo para o CID pode ser copiado e utilizado novamente.
Diferentemente do processo do CID, no processo para os dados sobre mortalidade serão geradas três tabelas, conforme documentado no DER, portanto a saída será redirecionada para três processadores, com auxílio da ferramenta Funnel, conforme ilustra a figura:
Cada script será responsável pela transformação dos dados relativos a uma das tabelas.
Metadados Sistema
Constam na tabela principal alguns dados de controle do sistema, portanto, foi criada uma nova entidade para armazenar esses dados.
fisico.sql | |
---|---|
O script responsável por fazer esse tratamento é:
format_metadados.py | |
---|---|
Investigação
O mesmo vale para os dados de investigação.
fisico.sql | |
---|---|
O script responsável por fazer esse tratamento é:
sim_format_investigacao.py | |
---|---|
Pessoa Falecida
O mesmo vale para os dados de pessoa falecida.
fisico.sql | |
---|---|
O script responsável por fazer esse tratamento é:
sim_format_dados_pessoa_falecida.py | |
---|---|
Óbito
O mesmo vale para os dados de óbito.
fisico.sql | |
---|---|
O script responsável por fazer esse tratamento é:
sim_format_obito.py | |
---|---|