Melhor formato tabular para analytics

CSV segue como a opcao padrao para ingestao analitica, com TSV e JSON como alternativas situacionais.

Recomendacao principal

CSV (Document)

CSV oferece a compatibilidade mais ampla entre ferramentas BI, planilhas e jobs ETL.

Arquivos disponiveis: 21

text/csv

Abrir amostras Abrir hub Abrir manifesto

Formatos alternativos e de fallback

TSV (Document)

Arquivos: 9

Use TSV quando os dados contiverem muitas virgulas e o escape ficar complicado.

Amostras Hub

JSON (Document)

Arquivos: 21

Use JSON para estruturas aninhadas e troca com schema.

Amostras Hub

JSONL (Data)

Arquivos: 9

Use JSONL para pipelines analiticos em streaming e append-only.

Amostras Hub

Fatores de decisao

  • Suporte de ingestao em ferramentas BI e data warehouses.
  • Necessidade de dados aninhados versus estruturas tabulares planas.
  • Frequencia de colisao de delimitador nos valores.
  • Processamento em batch versus streaming.

Erros comuns a evitar

  • Usar CSV para entidades muito aninhadas sem estrategia de flatten.
  • Ignorar normalizacao de delimitador e aspas na origem.
  • Pular validacao de schema antes da ingestao.

Comparacoes relacionadas

CSV vs TSV

Choose between comma-delimited CSV and tab-delimited TSV for tabular exchange.

Abrir comparacao

CSV vs JSON

Compare CSV tabular plano com JSON estruturado para troca de dados.

Abrir comparacao

JSON vs JSONL

Escolha entre JSON tipo documento e fluxos JSONL delimitados por linha.

Abrir comparacao

Guias relacionados de caso de uso e conversao

Guias por caso de uso

Guias de conversao