# Nota Metodológica — Anuário HC College 2026

**Slug:** 2026-04-15-anuario-college
**Data:** 2026-04-15
**Produto afetado:** HC-Anuário-College (Anuário anual sobre brasileiros no college tennis americano)
**Versão:** v1.0 — versão de lançamento

## Resumo

O Anuário HC College 2026 é o estudo anual do Hard Court Brasil sobre a trajetória de atletas brasileiros no circuito universitário americano (NCAA D1/D2/D3 + NAIA + JUCO). Publicação narrativa de 13 capítulos com dados primários cruzados de múltiplas fontes, dirigida a pais de atletas, treinadores, jornalistas e pesquisadores acadêmicos que querem entender o fenômeno.

## Definições canônicas

### Brasileiro no college americano (N=741)
Atleta brasileiro atualmente ativo em time universitário americano, coletado via scraping do **ITA (Intercollegiate Tennis Association)**. Atualizado mensalmente. **Fonte:** tabela `ita_brasileiros`.

### Recruta brasileiro (N=625, histórico)
Atleta brasileiro registrado no TennisRecruiting.net com universidade + divisão declaradas. Histórico acumulado de 2003 a 2017. **Fonte:** tabela `recrutas_brasil`.

### Benchmark WTN por divisão NCAA
Valor mediano do WTN (World Tennis Number) dos 71 recrutas brasileiros com matches entre `recrutas_brasil` e `atletas` do TI. Valores canônicos:
- **D1:** mediana 20,8 (P25 14,5 · P75 30,2 · N=37)
- **D2:** mediana 24,3 (P25 18,1 · P75 30,2 · N=17)
- **D3:** mediana 23,6 (P25 19,4 · P75 25,7 · N=8)
- **NAIA:** mediana 29,3 (P25 28,2 · P75 33,7 · N=8)

## Método de cálculo

### Query canônica — brasileiros ativos no college
```sql
SELECT COUNT(*) FROM ita_brasileiros
```

### Query canônica — benchmark WTN por divisão
```sql
SELECT divisao, COUNT(*) n,
       PERCENTILE(wtn_simples, 0.25) p25,
       PERCENTILE(wtn_simples, 0.50) mediana,
       PERCENTILE(wtn_simples, 0.75) p75
FROM recrutas_brasil r
JOIN atletas a ON lower(a.nome) = lower(r.nome)
WHERE r.universidade IS NOT NULL AND a.wtn_simples IS NOT NULL
GROUP BY divisao
```

### Mapeamento universidade → divisão NCAA
Feito manualmente a partir de 96 universidades únicas identificadas nos recrutas brasileiros, cruzando com NCAA directory oficial. Resultado: 116 recrutas com divisão mapeada (60 D1, 31 D2, 9 D3, 11 NAIA, 5 JUCO).

## Universo

**Escopo:** atletas brasileiros com trajetória college rastreável.

**Critério de inclusão:**
- **ITA ativos:** atleta listado em time universitário americano no momento da coleta (2026)
- **Histórico:** atleta cadastrado no TennisRecruiting com universidade + ano de formatura

**Exclusões:**
- Atletas sem nome completo (cruzamento por nome é base; sem isso não há match)
- Atletas que atuaram em nível amador/JUCO sem registro na ITA
- Universidades fora do NCAA/NAIA (ex: divisões menores sem associação reconhecida)

## Janela temporal

- **ITA (ativos):** snapshot do momento da coleta (mensal)
- **TennisRecruiting (histórico):** 2003 a 2017 (última rodada coletada)
- **Dados efetivamente analisados neste Anuário:** até 15/04/2026
- **Cadência editorial do Anuário:** anual (próxima edição abril/2027)

## Fonte primária

| Dado | Tabela | Origem |
|---|---|---|
| Brasileiros ativos college | `ita_brasileiros` | ITA Tennis (scraping) |
| Recrutas históricos | `recrutas_brasil` | TennisRecruiting.net |
| Cruzamento com atletas BR | `atletas_unificados` | Hard Court (cross-link ITA/UTR/TR) |
| Partidas BR | `partidas` | Tenis Integrado (IDs reais) |
| WTN | `atletas` + `wtn_historico` | Tenis Integrado + API GraphQL ITF |
| Tuition/universidade dados | `universidades_academico` | US Dept of Education College Scorecard |

## Limitações conhecidas

1. **Cruzamento por nome é frágil** — nomes comuns (ex: "Gabriel Oliveira") podem gerar falsos positivos. Mitigação: quando possível, cross-ref com idade+UF+ano de formatura.
2. **WTN do recruta histórico ≠ WTN no momento do recrutamento** — atleta pode ter melhorado após entrar no college. Benchmark reflete estado atual, não o perfil de entrada.
3. **Amostras pequenas (D3 e NAIA, N=8)** — resultados indicativos, não robustos. Próximas edições devem aumentar N à medida que o banco cresce.
4. **Cobertura incompleta do histórico** — TennisRecruiting cobre até 2017; atletas recrutados entre 2018-2023 só aparecem via ITA se ainda ativos. Gap histórico conhecido.
5. **Conflito potencial ITA × TennisRecruiting** — mesmo atleta pode aparecer nas duas bases com dados ligeiramente diferentes (universidade que transferiu, por exemplo). Tratamento: priorizamos ITA quando ambos estão presentes (estado atual).

## Histórico de revisões

- **2026-04-15 (v1.0):** versão de lançamento. Estudo aberto com 13 capítulos. Próxima entrada será registrada quando houver alteração de dado ou metodologia pós-lançamento.

## Referências cruzadas

- Norma editorial HC: `/docs/PADRAO_RELATORIOS_HC.md`
- Glossário canônico: `/docs/GLOSSARIO_HC.md`
- Tabelas canônicas do banco: `docs/TABELAS_CANONICAS.md` (interno)
- Pesquisa institucional base: `docs/PADROES_INSTITUCIONAIS_REFERENCIA.md` (interno)
- Ferramenta complementar de consulta: `/guia` (dashboard interativo 1.104 universidades)
- Lei fundamental editorial: `feedback_lei_fundamental_publicacao.md` (memory interno)

## Como citar

> *Hard Court Brasil. (2026). Anuário HC College 2026 — Brasileiros no College Tennis Americano, v1.0. hardcourtbrasil.com/anuario-college-2026. Nota metodológica: hardcourtbrasil.com/docs/notas/2026-04-15-anuario-college.md. Acesso em: DD/MM/AAAA.*
