# Nota Metodológica — Raio X do Tênis Brasileiro

**Slug:** 2026-04-15-raio-x-brasil
**Data:** 2026-04-15
**Produto afetado:** HC-RaioX-Brasil (Raio X do Tênis Brasileiro — macro público)
**Versão:** v1.0 — versão de lançamento

## Resumo

O Raio X do Tênis Brasileiro é o produto macro de autoridade pública do Hard Court. Apresenta em uma única página o retrato estatístico do tênis infanto-juvenil brasileiro em 2026: base de dados, funil real até o college, atividade por idade/estado, economia do circuito profissional. Serve como porta de entrada editorial pro HC (SEO + credibilidade) e como fonte citável por jornalistas e pesquisadores.

## Definições canônicas

### Base de dados (N=60.694 · 461.003 partidas · 6.991 torneios)
- **Atletas (60.694):** toda entrada no banco HC, inclusive adversários mapeados em partidas. Tabela `atletas`. Ver [TABELAS_CANONICAS.md](./TABELAS_CANONICAS.md).
- **Partidas (461.003):** todas as partidas oficiais coletadas do Tenis Integrado entre 2007 e 2026. Tabela `partidas`.
- **Torneios (6.991):** todos os torneios cadastrados no TI no período. Tabela `torneios`.

### Funil até o college (1,55% chega · 0,28% ativo)
Funil em 5 etapas:
1. **47.762 jogaram TI** — atletas únicos com ao menos 1 partida registrada no período histórico
2. **29.028 com WTN** (61%) — atletas com rating oficial ITF coletado
3. **741 brasileiros no college** (1,55%) — ativos na ITA em 2026 (tabela `ita_brasileiros`)
4. **625 recrutados históricos** (1,31%) — registrados no TennisRecruiting 2003-2017
5. **133 ativos no circuito pro** (0,28%) — brasileiros com partidas ATP/WTA/Futures nos últimos 3 anos

### Atividade 2026 por estado
Atletas ativos 2026 por UF do torneio. Query canônica em [nota metodológica do Panorama Estadual](/docs/notas/2026-04-15-panorama-estadual.md).

## Método de cálculo

### Query canônica — total de partidas
```sql
SELECT COUNT(*) FROM partidas
```

### Query canônica — brasileiros no college ativos
```sql
SELECT COUNT(*) FROM ita_brasileiros
```

### Query canônica — funil primeiro nível
```sql
SELECT COUNT(DISTINCT id_atleta) FROM partidas
WHERE categoria NOT LIKE '%Dupla%' AND resultado IN ('V','D')
```

## Universo

**Escopo:** atletas brasileiros com registro no circuito federado brasileiro (Tenis Integrado) entre 2007 e 2026, cruzados com fontes externas (ITA, TennisRecruiting, ATP/WTA, UTR, COSAT).

**Critério de inclusão:**
- Qualquer atleta com ao menos 1 partida oficial registrada no TI
- Partida coletada via scraping direto (IDs reais de atleta e adversário)

**Exclusões:**
- Atletas amadores sem registro no TI (circuito clubístico informal, torneios sem homologação)
- Partidas de duplas (`categoria LIKE '%Dupla%'`)
- Resultados WO ambíguos ou `?` (parsing pendente)
- Torneios tipo "evento agregado" (rankings/ligas anuais consolidados em um único registro)

## Janela temporal

- **Histórico completo da base:** 2007–2026
- **Dados parciais 2026:** atualizados até 15/04/2026
- **Próxima edição:** mensal (15 de cada mês)

## Fontes primárias

| Dado | Tabela/Endpoint | Origem |
|---|---|---|
| Partidas | `partidas` | Tenis Integrado (scraping com IDs reais) |
| Atletas | `atletas` · `atletas_unificados` | TI + cross-link ITA/UTR/TR |
| Torneios | `torneios` | TI |
| Rankings oficiais | `ranking_atletas` | Endpoint `new_ranking/index_ranking/{fid}` do TI |
| College ativos | `ita_brasileiros` | ITA Tennis (scraping) |
| College histórico | `recrutas_brasil` | TennisRecruiting.net |
| Profissionais BR | `profissionais_hc` | HC próprio (derivado de 46k partidas TI de 915 atletas) |
| Universidades | `universidades_academico` | U.S. Dept. of Education College Scorecard |
| WTN histórico | `wtn_historico` | API GraphQL ITF |

## Deflatores

- **USD:** CPI-U americano (base abril/2026)
- **BRL:** IPCA série 433 do IBGE (base março/2026)
- **Fluxos futuros:** valores constantes da data-base; taxa de desconto real 6% a.a. (Brealey-Myers-Allen / Damodaran)
- Ver documento `metodologia de custos/HC_Metodologia_Custos_Consolidada_v1.3.docx` pra detalhes

## Limitações conhecidas

1. **Cobertura limitada a atletas federados** — amadores informais não constam. HC não representa "o tênis brasileiro inteiro", só "o tênis competitivo federado".
2. **Cruzamento por nome entre bases** (TI × ITA × TennisRecruiting × ATP/WTA) — nomes comuns geram falsos positivos. Mitigação: quando possível, cross-ref com idade/UF/ano de formatura.
3. **Gap histórico TennisRecruiting** — cobertura robusta até 2017; atletas recrutados entre 2018-2023 aparecem só via ITA (se ainda ativos).
4. **Inflação de 2026 ainda parcial** — IPCA de meses futuros do ano ainda não publicado; projeções podem ser revisadas quando IBGE divulgar.
5. **`atletas_unificados.uf`** contém ruído histórico (cidade no campo UF em alguns registros) — mitigado via `normalize_uf()` em `hc_core.py`.

## Histórico de revisões

- **2026-04-15 (v1.0):** versão de lançamento. Próxima entrada será registrada quando houver alteração de dado ou metodologia pós-lançamento.

## Referências cruzadas

- Norma editorial HC: `/docs/PADRAO_RELATORIOS_HC.md`
- Glossário canônico: `/docs/GLOSSARIO_HC.md`
- Metodologia de custos: `metodologia de custos/HC_Metodologia_Custos_Consolidada_v1.3.docx` (interno)
- Nota metodológica Anuário College: `/docs/notas/2026-04-15-anuario-college.md`
- Nota metodológica Panorama Estadual: `/docs/notas/2026-04-15-panorama-estadual.md`

## Como citar

> *Hard Court Brasil. (2026). Raio X do Tênis Brasileiro, v1.0. hardcourtbrasil.com/raio-x-brasileiro. Nota metodológica: hardcourtbrasil.com/docs/notas/2026-04-15-raio-x-brasil.md. Acesso em: DD/MM/AAAA.*
