brutos_bcadastro

Projeto: rj-iplanrio

O modelo cnpj é um conjunto de dados abrangente que contém informações detalhadas sobre empresas, incluindo seus dados cadastrais, informações de contato, detalhes de localização, informações sobre o quadro societário e informações sobre empresas sucedidas. Inclui campos como CNPJ (um identificador único para empresas no Brasil), nomes, informações de contato (telefone e e-mail), detalhes de endereço (incluindo cidade, estado e país), informações sobre a natureza jurídica da empresa, informações sobre o porte da empresa e outras informações relevantes. Este modelo é particularmente útil para usuários de negócios que precisam entender a demografia das empresas, acompanhar dados das empresas ao longo do tempo ou analisar o comportamento da empresa com base em atributos cadastrais ou de localização.

3
Tabelas
158
Colunas Totais

Google Colab

Analise este dataset em um notebook Colab

Ao clicar abrimos o Colab em nova aba e copiamos o notebook padrão para sua área de transferência.

cnpj

98 colunas • Criado em 14/12/2025, 09:19:54

Abrir no BigQuery
Nome da Coluna Tipo Descrição
cnpj
STRING
Esta coluna representa o CNPJ (Cadastro Nacional da Pessoa Jurídica), que é um identificador único para empresas brasileiras. É armazenado como uma string e é crucial para identificar empresas individuais no Brasil. Formato: 14 dígitos numéricos Exemplo: 00000000000191
razao_social
STRING
Nome empresarial (razão social) da empresa.
nome_fantasia
STRING
Nome fantasia da empresa.
capital_social
INT64
Capital social da empresa em reais.
cnae_fiscal
STRING
Código CNAE (Classificação Nacional de Atividades Econômicas) principal da empresa.
cnae_secundarias
ARRAY<STRING>
Lista de códigos CNAE secundários da empresa.
nire
STRING
NIRE (Número de Identificação do Registro de Empresas) da empresa.
natureza_juridica
STRUCT<id STRING, descricao STRING>
Natureza jurídica da entidade, incluindo identificador único e descrição.
natureza_juridica.id
STRING
Identificador único da natureza jurídica.
natureza_juridica.descricao
STRING
Descrição da natureza jurídica.
porte
STRUCT<id STRING, descricao STRING>
Porte da empresa.
porte.id
STRING
Identificador único do porte.
porte.descricao
STRING
Descrição do porte.
matriz_filial
STRUCT<id STRING, descricao STRING>
Indica se a empresa é matriz ou filial.
matriz_filial.id
STRING
Identificador de matriz (1) ou filial (2).
matriz_filial.descricao
STRING
Descrição de matriz ou filial.
orgao_registro
STRUCT<id STRING, descricao STRING>
Autoridade de registro da entidade, incluindo identificador único e descrição.
orgao_registro.id
STRING
Identificador único do tipo de órgão de registro.
orgao_registro.descricao
STRING
Descrição do tipo de órgão de registro.
inicio_atividade_data
DATE
Data de início das atividades da empresa.
situacao_cadastral
STRUCT<id STRING, descricao STRING, data DATE, motivo_id STRING, motivo_descricao STRING>
Status de registro da entidade, incluindo identificador, descrição, data e motivo.
situacao_cadastral.id
STRING
Identificador único da situação cadastral.
situacao_cadastral.descricao
STRING
Descrição da situação cadastral.
situacao_cadastral.data
DATE
Data da situação cadastral.
situacao_cadastral.motivo_id
STRING
Identificador único do motivo da situação cadastral.
situacao_cadastral.motivo_descricao
STRING
Descrição do motivo da situação cadastral.
situacao_especial
STRUCT<descricao STRING, data DATE>
Situação especial da empresa, incluindo descrição e data.
situacao_especial.descricao
STRING
Descrição da situação especial.
situacao_especial.data
DATE
Data da situação especial.
ente_federativo
STRUCT<id STRING, tipo STRING>
Entidade federativa associada à empresa, incluindo identificador e tipo.
ente_federativo.id
STRING
Identificador do Ente Federativo Responsável.
ente_federativo.tipo
STRING
Tipo do Ente Federativo Responsável.
contato
STRUCT<telefone ARRAY<STRUCT<ddd STRING, telefone STRING>>, email STRING>
Informações de contato da empresa, incluindo telefones e e-mail.
contato.telefone
ARRAY<STRUCT<ddd STRING, telefone STRING>>
Lista de telefones da empresa com DDD e número.
contato.telefone.ddd
STRING
Sem descrição
contato.telefone.telefone
STRING
Sem descrição
contato.email
STRING
Endereço de e-mail da empresa.
endereco
STRUCT<cep STRING, id_pais STRING, uf STRING, id_municipio STRING, municipio_nome STRING, municipio_exterior_nome STRING, bairro STRING, tipo_logradouro STRING, logradouro STRING, numero STRING, complemento STRING>
Endereço completo da empresa, incluindo CEP, localização e detalhes do logradouro.
endereco.cep
STRING
CEP do endereço da empresa.
endereco.id_pais
STRING
Identificador único do país onde a empresa está localizada.
endereco.uf
STRING
Estado (UF) do endereço.
endereco.id_municipio
STRING
Identificador único do município onde a empresa está localizada.
endereco.municipio_nome
STRING
Nome do município do endereço.
endereco.municipio_exterior_nome
STRING
Nome da cidade no exterior.
endereco.bairro
STRING
Bairro do endereço.
endereco.tipo_logradouro
STRING
Tipo de logradouro do endereço.
endereco.logradouro
STRING
Logradouro do endereço.
endereco.numero
STRING
Número do endereço.
endereco.complemento
STRING
Complemento do endereço.
contador
STRUCT<pf STRUCT<tipo_crc STRING, classificacao_crc STRING, sequencial_crc STRING, id STRING>, pj STRUCT<id STRING, tipo_crc STRING, classificacao_crc STRING, sequencial_crc STRING>>
Informações do contador da empresa, incluindo dados de pessoa física e jurídica.
contador.pf
STRUCT<tipo_crc STRING, classificacao_crc STRING, sequencial_crc STRING, id STRING>
Informações do contador pessoa física.
contador.pf.tipo_crc
STRING
Tipo do CRC do contador pessoa física.
contador.pf.classificacao_crc
STRING
Classificação do CRC do contador pessoa física.
contador.pf.sequencial_crc
STRING
Número sequencial do CRC do contador pessoa física.
contador.pf.id
STRING
CPF do contador pessoa física.
contador.pj
STRUCT<id STRING, tipo_crc STRING, classificacao_crc STRING, sequencial_crc STRING>
Informações do contador pessoa jurídica.
contador.pj.id
STRING
CNPJ do contador pessoa jurídica.
contador.pj.tipo_crc
STRING
Tipo do CRC do contador pessoa jurídica.
contador.pj.classificacao_crc
STRING
Classificação do CRC do contador pessoa jurídica.
contador.pj.sequencial_crc
STRING
Número sequencial do CRC do contador pessoa jurídica.
responsavel
STRUCT<cpf STRING, qualificacao_id STRING, qualificacao_descricao STRING, inclusao_data DATE>
Informações da pessoa responsável pela empresa, incluindo CPF, qualificação e data de inclusão.
responsavel.cpf
STRING
CPF do responsável.
responsavel.qualificacao_id
STRING
Identificador único da qualificação do responsável.
responsavel.qualificacao_descricao
STRING
Qualificação do responsável.
responsavel.inclusao_data
DATE
Data de inclusão do responsável.
tipos_unidade
ARRAY<STRING>
Tipos de unidade da empresa.
formas_atuacao
ARRAY<STRING>
Formas de atuação da empresa.
socios_quantidade
INT64
Quantidade de sócios.
socios
ARRAY<STRUCT<codigo_pais STRING, cpf_socio STRING, cnpj_socio STRING, cpf_representante_legal STRING, data_situacao_especial DATE, nome_socio_estrangeiro STRING, qualificacao_representante_legal STRING, qualificacao_socio STRING, tipo STRING>>
Lista de sócios da empresa com informações detalhadas.
socios.codigo_pais
STRING
Código do país do sócio.
socios.cpf_socio
STRING
CPF do sócio (quando pessoa física).
socios.cnpj_socio
STRING
CNPJ do sócio (quando pessoa jurídica).
socios.cpf_representante_legal
STRING
CPF do representante legal do sócio.
socios.data_situacao_especial
DATE
Data de entrada do sócio na empresa.
socios.nome_socio_estrangeiro
STRING
Nome do sócio estrangeiro (quando aplicável).
socios.qualificacao_representante_legal
STRING
Qualificação do representante legal do sócio.
socios.qualificacao_socio
STRING
Qualificação do sócio.
socios.tipo
STRING
Tipo do sócio.
sucessoes
ARRAY<STRUCT<evento_sucedida STRING, data_evento_sucedida DATE, data_processamento DATE, sucessoras STRING>>
Lista de sucessões empresariais.
sucessoes.evento_sucedida
STRING
Descrição do evento de sucessão empresarial.
sucessoes.data_evento_sucedida
DATE
Data do evento de sucessão empresarial.
sucessoes.data_processamento
DATE
Data de processamento da sucessão.
sucessoes.sucessoras
STRING
Lista de empresas sucessoras.
timestamp
STRING
Timestamp da extração dos dados.
language
STRING
Código do idioma.
couchdb
STRUCT<id STRING, key STRING, rev STRING, seq STRING, last_seq STRING>
Sem descrição
couchdb.id
STRING
Sem descrição
couchdb.key
STRING
Sem descrição
couchdb.rev
STRING
Sem descrição
couchdb.seq
STRING
Sem descrição
couchdb.last_seq
STRING
Sem descrição
airbyte
STRUCT<raw_id STRING, extracted_at TIMESTAMP, generation_id INT64, changes STRING, sync_id STRING>
Sistema de controle de versão e sincronização do Airbyte.
airbyte.raw_id
STRING
ID bruto do Airbyte.
airbyte.extracted_at
TIMESTAMP
Data e hora da extração pelo Airbyte.
airbyte.generation_id
INT64
ID de geração do Airbyte.
airbyte.changes
STRING
Alterações detectadas pelo Airbyte.
airbyte.sync_id
STRING
ID de sincronização do Airbyte.
cnpj_particao
INT64
Partição do CNPJ para otimização de processamento e consulta.

cpf

56 colunas • Criado em 14/12/2025, 09:19:23

Abrir no BigQuery
Nome da Coluna Tipo Descrição
cpf
STRING
Número de inscrição no Cadastro de Pessoas Físicas (CPF)
nome
STRING
Nome completo do contribuinte
nome_social
STRING
Nome social do contribuinte, quando aplicável
mae_nome
STRING
Nome completo da mãe do contribuinte
nascimento_data
DATE
Data de nascimento do contribuinte
inscricao_data
DATE
Data de inscrição no CPF
atualizacao_data
DATE
Data da última atualização do registro
situacao_cadastral_tipo
STRING
Situação cadastral do CPF (ex: Regular, Suspenso, Cancelado, etc)
sexo
STRING
Sexo do contribuinte (masculino/feminino)
obito_ano
STRING
Ano do óbito, se aplicável
estrangeiro_indicador
BOOL
Indica se o contribuinte é estrangeiro (true/false)
residente_exterior_indicador
BOOL
Indica se o contribuinte é residente no exterior (true/false)
contato
STRUCT<telefone STRUCT<ddi STRING, ddd STRING, numero STRING>, email STRING>
Sem descrição
contato.telefone
STRUCT<ddi STRING, ddd STRING, numero STRING>
Sem descrição
contato.telefone.ddi
STRING
Código DDI do telefone do contribuinte
contato.telefone.ddd
STRING
Código DDD do telefone do contribuinte
contato.telefone.numero
STRING
Número do telefone do contribuinte
contato.email
STRING
Endereço de e-mail do contribuinte
endereco
STRUCT<cep STRING, id_pais STRING, pais STRING, uf STRING, id_municipio STRING, municipio STRING, bairro STRING, tipo_logradouro STRING, logradouro STRING, numero STRING, complemento STRING>
Sem descrição
endereco.cep
STRING
CEP do endereço do contribuinte
endereco.id_pais
STRING
Sem descrição
endereco.pais
STRING
Sem descrição
endereco.uf
STRING
Unidade Federativa do endereço do contribuinte
endereco.id_municipio
STRING
Sem descrição
endereco.municipio
STRING
Município do endereço do contribuinte
endereco.bairro
STRING
Bairro do endereço do contribuinte
endereco.tipo_logradouro
STRING
Tipo do logradouro do endereço (ex: Rua, Avenida, etc)
endereco.logradouro
STRING
Nome do logradouro do endereço
endereco.numero
STRING
Número do endereço
endereco.complemento
STRING
Complemento do endereço
nascimento_local
STRUCT<id_pais STRING, pais STRING, uf STRING, id_municipio STRING, municipio STRING>
Sem descrição
nascimento_local.id_pais
STRING
Sem descrição
nascimento_local.pais
STRING
Sem descrição
nascimento_local.uf
STRING
Sem descrição
nascimento_local.id_municipio
STRING
Sem descrição
nascimento_local.municipio
STRING
Sem descrição
ocupacao
STRUCT<id STRING, nome STRING, id_natureza STRING, id_ua STRING>
Sem descrição
ocupacao.id
STRING
Sem descrição
ocupacao.nome
STRING
Nome da ocupação do contribuinte
ocupacao.id_natureza
STRING
Sem descrição
ocupacao.id_ua
STRING
ID da unidade administrativa
metadados
STRUCT<ano_exercicio INT64, version STRING, tipo STRING, timestamp STRING>
Sem descrição
metadados.ano_exercicio
INT64
Ano do exercício fiscal
metadados.version
STRING
Versão do registro
metadados.tipo
STRING
Tipo do registro
metadados.timestamp
STRING
Timestamp do registro
airbyte
STRUCT<seq STRING, last_seq STRING, airbyte_raw_id STRING, airbyte_extracted_at TIMESTAMP, airbyte_meta STRUCT<changes STRING, sync_id STRING>, airbyte_generation_id INT64>
Sem descrição
airbyte.seq
STRING
Sequência do registro no Airbyte
airbyte.last_seq
STRING
Última sequência do registro no Airbyte
airbyte.airbyte_raw_id
STRING
ID do registro raw no Airbyte
airbyte.airbyte_extracted_at
TIMESTAMP
Data e hora da extração do registro pelo Airbyte
airbyte.airbyte_meta
STRUCT<changes STRING, sync_id STRING>
Sem descrição
airbyte.airbyte_meta.changes
STRING
Mudanças detectadas pelo Airbyte
airbyte.airbyte_meta.sync_id
STRING
ID da sincronização no Airbyte
airbyte.airbyte_generation_id
INT64
ID da geração do registro no Airbyte
cpf_particao
INT64
Campo usado para particionamento da tabela

dominio

4 colunas • Criado em 14/12/2025, 09:17:18

Abrir no BigQuery
Nome da Coluna Tipo Descrição
id
STRING
Código Identificador
descricao
STRING
Descrição do identificador
column
STRING
Identificador do dominio (sexo, codigo_pais, tipo_socio, ...)
source
STRING
Indica se a fonte do dominio é cpf ou cnpj