Dimensão de projetos GCP com classificação centralizada de órgão e ambiente. Centraliza a lógica de derivação de orgao/ambiente/projeto_base para evitar duplicação em modelos downstream. Inclui todos os projetos do INFORMATION_SCHEMA mais projetos adicionais do billing.\n
5
Tabelas
155
Colunas Totais
Google Colab
Analise este dataset em um notebook Colab
Ao clicar abrimos o Colab em nova aba e copiamos o notebook padrão para sua área de transferência.
Identificador do job no BigQuery. Único em combinação com project_id (unique_key no modelo).
principal_email
STRING
Email do principal normalizado (lowercase).
principal_type
STRING
Tipo de principal: human, service_account, compute_engine, google_apis, unknown.
is_service_account
BOOL
Flag booleana indicando se o principal é uma service account.
orgao
STRING
Órgão ou secretaria responsável pelo projeto.
ambiente
STRING
Ambiente do projeto: prod, dev, sandbox.
projeto_base
STRING
Nome base do projeto sem sufixos de ambiente.
user_email
STRING
Email original do usuário ou service account.
job_type
STRING
Tipo do job: QUERY, LOAD, EXPORT, etc.
statement_type
STRING
Tipo de statement SQL: SELECT, INSERT, UPDATE, DML, DDL, etc.
creation_time
TIMESTAMP
Data e hora de criação do job (UTC).
end_time
TIMESTAMP
Data e hora de término do job (UTC).
job_date_utc
DATE
Data do job em UTC (DATE(creation_time)).
job_month_utc
DATE
Mês do job em UTC (primeiro dia do mês).
invoice_month_date
DATE
Mês de referência para faturamento (primeiro dia do mês). Sempre presente, derivado de job_month_utc. Usado como campo de particionamento.
billing_invoice_month_date
DATE
Mês da invoice do billing quando há match (primeiro dia do mês). Derivado de invoice.month (YYYYMM) do billing. Pode ser NULL se não houver billing para este projeto/mês.
total_bytes_billed
INT64
Total de bytes faturados por este job específico.
total_bytes_project_month
INT64
Total de bytes faturados por todos os jobs do projeto neste mês. Usado como denominador na alocação proporcional.
bigquery_cost_gross
FLOAT64
Custo bruto do BigQuery para o projeto/mês (antes de créditos). Agregação de cost do billing para service.description = 'BigQuery'.
bigquery_credits
FLOAT64
Total de créditos aplicados ao BigQuery para o projeto/mês. Soma de credits.amount (valores negativos representam descontos).
bigquery_cost_net
FLOAT64
Custo líquido do BigQuery para o projeto/mês (após créditos). Calculado como: bigquery_cost_gross + bigquery_credits. Este é o valor que foi efetivamente faturado.
allocated_cost_job
FLOAT64
Custo alocado para este job específico (em USD). Calculado proporcionalmente aos bytes faturados: (total_bytes_billed / total_bytes_project_month) * bigquery_cost_net. A soma de allocated_cost_job por projeto/mês deve ser ≈ bigquery_cost_net.
job_cost_proportion
FLOAT64
Proporção do job no total do projeto/mês (valor entre 0 e 1). Calculado como: total_bytes_billed / total_bytes_project_month. Útil para análise de concentração de custo.
Projeto GCP de origem do job (ex: rj-iplanrio, rj-iplanrio-dev, etc). Indica de qual projeto o job foi extraído para fins de auditoria e rastreabilidade.
project_id
STRING
ID do projeto GCP onde o job foi executado. Exemplo: 'rj-iplanrio'.
job_id
STRING
Identificador único do job no BigQuery, utilizado para rastreamento e auditoria. Exemplo: 'job_1234567890abcdef'.
user_email
STRING
E-mail do usuário ou conta de serviço responsável pela execução do job. Exemplo: 'usuario@iplanrio.rj.gov.br'. Pode ser nulo em execuções automáticas.
job_type
STRING
Tipo do job executado (ex: QUERY, LOAD, EXPORT, etc). Indica a natureza da operação realizada no BigQuery.
query
STRING
Consulta SQL executada pelo job, quando aplicável. Pode ser nulo para jobs que não envolvem SQL diretamente (ex: LOAD, EXPORT).
state
STRING
Status final do job (ex: DONE, PENDING, RUNNING, FAILED). Indica o resultado da execução.
destination_project_id
STRING
ID do projeto de destino dos resultados do job, quando aplicável. Exemplo: 'rj-iplanrio'. Pode ser nulo para jobs sem destino definido.
destination_dataset_id
STRING
Dataset de destino dos resultados do job, quando aplicável. Exemplo: 'meu_dataset'. Pode ser nulo.
destination_table_id
STRING
Tabela de destino dos resultados do job, quando aplicável. Exemplo: 'minha_tabela'. Pode ser nulo.
Projeto GCP de origem do job (ex: rj-iplanrio, rj-iplanrio-dev). Indica de qual projeto o job foi extraído via INFORMATION_SCHEMA.
project_id
STRING
ID do projeto GCP onde o job foi executado.
job_id
STRING
Identificador do job no BigQuery. Único em combinação com project_id (ver teste dbt_utils.unique_combination_of_columns).
user_email
STRING
E-mail do usuário ou conta de serviço responsável pela execução do job.
principal_email
STRING
Email do principal normalizado (lowercase) para facilitar joins e agrupamentos.
is_service_account
BOOL
Flag booleana indicando se o principal é uma service account (email termina com gserviceaccount.com).
principal_type
STRING
Tipo de principal que executou o job. Valores: user (usuário), service_account (conta de serviço), compute_engine (Compute Engine default SA), google_apis (Google APIs service account), unknown (não identificado).
job_type
STRING
Tipo do job executado (ex: QUERY, LOAD, EXPORT).
query
STRING
Consulta SQL executada pelo job, quando aplicável.
state
STRING
Status final do job (ex: DONE, PENDING, RUNNING, FAILED).
destination_project_id
STRING
ID do projeto de destino dos resultados do job.
destination_dataset_id
STRING
Dataset de destino dos resultados do job.
destination_table_id
STRING
Tabela de destino dos resultados do job.
error_result
STRING
Informação sobre erro do job, quando houver. Nulo se bem-sucedido. Serializado como JSON string do STRUCT original.
creation_time
TIMESTAMP
Data e hora de criação do job (horário UTC).
end_time
TIMESTAMP
Data e hora de término do job (horário UTC).
statement_type
STRING
Tipo de statement SQL executado (ex: SELECT, INSERT, UPDATE, DML, DDL).
total_bytes_processed
INT64
Total de bytes processados pelo job.
total_bytes_billed
INT64
Total de bytes faturados pelo job.
job_date_utc
DATE
Data do job em UTC, derivada de DATE(creation_time). Diferente da v1 que usava PST8PDT.
job_month_utc
DATE
Mês do job em UTC (primeiro dia do mês), usado para particionamento. Derivado de DATE_TRUNC(DATE(creation_time), MONTH).
orgao
STRING
Órgão ou secretaria responsável pelo projeto, obtido via join com raw_dim_gcp_project.
ambiente
STRING
Ambiente do projeto (prod, dev, sandbox), obtido via join com raw_dim_gcp_project.
projeto_base
STRING
Nome base do projeto sem sufixos de ambiente, obtido via join com raw_dim_gcp_project.