Predicciones ML — Florida Predictor

Estado del Sistema

Cargando...

σ²

Chi-Squared (χ²)

Fase 2

Análisis estadístico de frecuencias — detecta números con desviación significativa de la distribución uniforme

Cargando análisis...

⛓

Markov Chain

Fase 2.5

Cadenas de transición secuencial — predice qué números tienden a seguir después de los números del último sorteo

Cargando análisis...

⏱

Gap Analyzer

Fase 3

Patrones temporales — detecta números overdue, rachas activas y ciclos de aparición

Cargando anÃ¡lisis...

🌲

XGBoost

Fase 4

Gradient Boosting — combina ~40 features tabulares (frecuencia, gaps, secuencia, posición, temporalidad) en un modelo unificado que captura interacciones no-lineales

Cargando análisis...

🎯

Ensemble

Fase 5

Combinación ponderada de todos los modelos usando Reciprocal Rank Fusion — los pesos se calibran automáticamente según la accuracy real de cada modelo

Cargando análisis...

Precisión

Últimos 30 días

Métricas de acierto de las predicciones evaluadas contra resultados reales

Cargando métricas...

¿Cómo funciona?

Guía completa del sistema de predicciones. Pulsa cada sección para expandir.

📊 Vista General del Sistema

El sistema analiza los resultados históricos de Florida Pick 3 usando 4 modelos matemáticos independientes más un Ensemble que los combina:

Chi-Squared (χ²) — ¿Qué números aparecen más de lo esperado?
Markov Chain — ¿Qué números suelen salir después de los actuales?
Gap Analyzer — ¿Qué números llevan mucho tiempo sin aparecer?
XGBoost — ¿Qué combinación de ~40 features predice mejor?
Ensemble 🎯 — Combinación ponderada de los 4 modelos via Rank Fusion. Los pesos se calibran automáticamente según accuracy real.

El Ensemble es la predicción principal del sistema. Cada modelo genera un Top 20 de números más probables, y el Ensemble los combina dando más peso a los modelos con mejor precisión histórica.

Top 20: Los 20 números (de 00 a 99) que el modelo considera más probables para el próximo sorteo.

Confianza: Indica qué tan seguro está el modelo. Con pocos datos será baja (~5-15%); con meses de datos sube (~30-50%). Una confianza del 40% NO significa 40% de probabilidad de acertar.

Consenso: Cuando varios modelos coinciden en un número, la predicción es más robusta. Un ✓ indica que todos los modelos lo seleccionaron.

σ² Chi-Squared (χ²) — Análisis de Frecuencias

Pregunta clave: ¿Qué números están apareciendo más (o menos) de lo que deberían por pura estadística?

En un juego justo, cada número del 00 al 99 debería aparecer con la misma frecuencia (1% cada uno). Chi-Squared detecta cuando un número aparece significativamente más que ese 1% esperado.

Cómo funciona paso a paso:

Cuenta cuántas veces apareció cada número en ventanas de tiempo: últimos 7 días, 15, 30, 60 y 90 días.
Compara esa frecuencia contra lo esperado (distribución uniforme).
Los sorteos más recientes pesan más que los antiguos (decaimiento exponencial).
Combina todas las ventanas con pesos: 7d (25%), 15d (25%), 30d (20%), 60d (15%), 90d (10%), todo (5%).
Normaliza los resultados para obtener una probabilidad final por número.

Cómo leer sus resultados:

Ventanas de Análisis: Cada tarjeta muestra una ventana temporal (ej: "30 días"), cuántos sorteos incluye y su peso en el resultado final.

Peso: La ventana de 7 días tiene 25% de influencia, priorizando tendencias recientes sin ignorar el largo plazo.

⛓ Markov Chain — Patrones Secuenciales

Pregunta clave: Dado lo que salió en el último sorteo, ¿qué números tienden a salir después?

Mientras Chi² mira "cuántas veces", Markov mira "qué sigue a qué". Si después del 42 históricamente suele salir el 17 o el 85, Markov lo detecta.

Cómo funciona paso a paso:

Recorre toda la historia de sorteos en orden cronológico.
Para cada par de sorteos consecutivos, registra: "después del número X salió el número Y".
Construye una tabla de 100×100 (una fila por cada número posible) con las probabilidades de transición.
Combina 3 señales: transiciones directas (50%), equilibrio a largo plazo (25%), y tendencias recientes (25%).

Cómo leer sus resultados:

Último Sorteo: Los 3 números base que Markov usa para predecir el siguiente. Si el último fue 42-15-88, busca qué suele venir después de cada uno.

Transición / Estacionaria / Recencia: Las 3 señales que combina. "Transición" es el patrón directo; "Estacionaria" es el equilibrio global; "Recencia" prioriza patrones de los últimos 10 sorteos.

Entropía: Mide la "aleatoriedad" de las transiciones. Cercana a 1.0 = muy aleatorio (pocos patrones). Cercana a 0 = patrones fuertes detectados.

¿Todos muestran ~1%? Es normal al inicio. Con pocos sorteos, el modelo no puede distinguir patrones claros y todos los números quedan cerca de 1% (distribución uniforme). Con más datos (50+ sorteos), los porcentajes empezarán a diferenciarse.

⏱ Gap Analyzer — Patrones Temporales

Pregunta clave: ¿Qué números llevan "demasiado tiempo" sin aparecer y cuáles están en racha?

El "gap" es la cantidad de sorteos que pasan entre cada aparición de un número. Si el número 55 normalmente aparece cada ~33 sorteos pero lleva 60 sin salir, Gap Analyzer lo marca como "overdue" (retrasado).

Cómo funciona paso a paso:

Para cada número, calcula cuántos sorteos han pasado desde su última aparición (gap actual).
Calcula el gap promedio histórico de ese número (media y desviación).
Compara el gap actual contra el promedio usando Z-score: ¿está muy por encima, muy por debajo, o en su rango normal?
Combina 4 señales: overdue (40%), racha (25%), ciclo (20%) y recencia (15%).

Cómo leer sus resultados:

■ Overdue — El número lleva muchos más sorteos de lo normal sin aparecer (Z-score > 1.5). Es la señal principal del modelo.

■ Casi Overdue — Está empezando a retrasarse (Z-score entre 0.5 y 1.5).

■ Hot — Apareció hace muy pocos sorteos (gap ≤ 3). Está en racha activa.

■ Ciclo — Su gap actual coincide con su promedio histórico (±25%). El número está "en hora" para volver a aparecer.

■ Neutral — Sin señal clara; el gap está dentro de rangos normales.

Gap: Sorteos desde la última aparición. "Gap: 45" = han pasado 45 sorteos sin ese número.

μ (Media): El gap promedio histórico. "μ: 28" = normalmente aparece cada ~28 sorteos.

Z (Z-score): Cuántas desviaciones por encima (o debajo) del promedio. Z > +2.0 = muy overdue. Z < -1.0 = apareció recientemente.

🎯 Métricas de Precisión — ¿Aciertan los modelos?

Después de cada sorteo real, el sistema evalúa automáticamente si alguno de los números predichos (Top 20, Top 10, Top 5) coincidió con el resultado.

Hit Top-20: ¿Alguno de los 3 números del resultado estaba en el Top 20 predicho? El azar puro da ~46% (20 de 100 números × 3 posiciones). Si el modelo supera eso, está encontrando patrones.

Hit Top-5: Predicción más arriesgada y valiosa. El azar da ~14.5%.

Match Exacto: El primer número (fijo) coincidió exactamente. El azar da ~20%. Este es el más importante para apuestas de "fijo".

vs Aleatorio: Cuánto mejor (o peor) que tirar los dados. "+15%" significa que el modelo acierta un 15% más que el azar puro.

ROI Simulado: Si apostaras $1 a cada predicción, ¿cuánto ganarías o perderías? Negativo es normal al inicio.

🎯 Ensemble — Combinación Final

Pregunta clave: ¿Cuál es la mejor predicción combinando TODOS los modelos?

El Ensemble no entrena un modelo propio. En cambio, toma los rankings de los 4 modelos y los combina usando Reciprocal Rank Fusion (RRF), un algoritmo probado en Information Retrieval.

Cómo funciona paso a paso:

Cada modelo genera un ranking de 100 números (posición 1 = más probable).
Para cada número, calcula: RRF = Σ peso(modelo) / (60 + rank). Números con mejor posición en más modelos obtienen mayor score.
Los pesos se calibran automáticamente: si un modelo acierta más en los últimos sorteos, su peso sube.
Genera un Top 20 final combinado con el consenso de todos los modelos.

Cómo leer sus resultados:

Pesos: Porcentaje de influencia de cada modelo. Se calibran automáticamente desde accuracy real o backtesting.

Fuente de pesos: "Accuracy Real" = basado en aciertos en producción. "Backtesting" = basado en simulación histórica. "Iguales" = 25% cada uno (sin datos aún).

Diversidad: Mide qué tan diferentes son los rankings entre modelos. Alta diversidad = cada modelo aporta información única. Baja diversidad = modelos redundantes.

Consenso (★): Cuántos modelos tienen ese número en su Top 20. ★★★★ = los 4 modelos coinciden (señal muy fuerte).

🔬 Backtesting — Validación Histórica

El backtesting simula "qué habría pasado" si el sistema hubiera estado activo en el pasado. Para cada sorteo histórico, entrena los modelos SOLO con datos anteriores a ese sorteo, predice, y compara contra el resultado real.

Baselines aleatorios (referencia):

Top-5 al azar: 14.4% — probabilidad de que al menos 1 de los 3 números reales esté en un top-5 aleatorio.

Top-10 al azar: 27.1%

Top-20 al azar: 48.5%

Primero en Top-20: 20.0% — acertar el primer número exacto estando en top-20.

Si un modelo supera consistentemente estos baselines, está encontrando patrones reales. Los resultados del backtesting se usan para calibrar los pesos del Ensemble.

El backtesting se ejecuta manualmente via API: POST /api/predictions/backtest

⚠️ Aviso importante: Este sistema es para fines educativos y de análisis estadístico. Los sorteos de lotería son eventos aleatorios y ningún modelo puede garantizar resultados. Juegue responsablemente y nunca apueste más de lo que pueda permitirse perder.