模型自学习
两层反馈让模型越用越准:确定性自动调参(用累积结果最小化 Brier)+ Claude Opus 智能分析(诊断偏差、补定性因素)。
Claude 智能反馈层
已启用 · claude-opus-4-8ai-review 定时任务会复盘近期误差给出调参建议(待人工审核),并对未来比赛补充伤病/动机/天气等定性因素。
说明:Claude 不「训练/微调」统计模型(LLM 无法被这样训练);它负责分析与定性增强,真正的参数拟合由下方确定性引擎完成。
自动调参引擎(演示)
历史样本
8 场
调参前 Brier
0.2276
调参后 Brier
0.2079
Brier 0.2276 → 0.2079,已采用新参数
参数调整:
marketBlendWeight: 0.65 → 0.4eloPerGoal: 100 → 125attackDefenseWeight: 0.5 → 0.7maxSupremacy: 2.5 → 3
这是在内置历史样本上的只读演示。线上由 auto-tune 定时任务在每批比赛结束后执行并写回生效参数。
当前生效参数
rho
-0.12
maxGoals
8
eloPerGoal
100
maxSupremacy
2.5
homeAdvantageGoals
0.25
attackDefenseWeight
0.5
marketBlendWeight
0.65
maxAvailabilityPenalty
0.25
noXgConfidencePenalty
0.15
contrarianThreshold
0.5
confidenceScale
4
调参日志
- 2026-06-22 21:400.2355 → 0.2355保持
- 2026-06-22 21:300.2355 → 0.2355保持
- 2026-06-22 20:370.2355 → 0.2355保持
- 2026-06-22 20:240.2433 → 0.2355已采用
Claude 调参建议(待审核)
- 41场样本中让球方向命中率约73%、整体可用,但大小球'大球'在高置信区间(≥0.7)严重过自信——C2/E4/H1/K1等0.7+大球落到0:0、0:1、1:1,7个高置信大球仅命中3个;同时B4(6:0)、E1(7:1)、F3(5:1)等强队大胜的让球被低估。说明进球分布右尾被高估、低比分与平局质量被压低,强队让球上限偏紧。偏差:大小球高置信区间偏乐观、过自信(高估大球与进球右尾);低比分/平局质量被低估(多场0:0、1:1未被充分预期);强队大胜场次让球受supremacy上限压制、略有低估;让球整体反而略偏欠自信(命中率高于平均报价概率,样本噪声大)
marketBlendWeight0.65→0.7 — 高置信大球系统性失准,向去水盘口多收敛可压缩极端大球概率、改善校准;againstMarket全为false,加权市场风险低。rho-0.12→-0.08 — 实际出现大量0:0/1:1/平局而高置信大球频繁落空,负rho过度压低了低比分相关性;向0小幅回调可增加低分与平局质量、缓解大球乐观偏差。maxSupremacy2.5→2.7 — 6:0、7:1、5:1等强队大胜导致让弱队一侧落空,当前supremacy上限对顶级强弱对抗略紧,小幅放宽以更好覆盖大分差;小步以防过拟合小样本。 - 41场样本中让球表现稳健(约73%命中,概率多压在0.52-0.60区间,校准良好甚至略显保守);主要问题在大小球:高概率大球档(0.65-0.73)多次落空(H1、E4、K1、C2),且多场以0:0/1:1闷平收场,整体大球略偏乐观。此外在极端强弱悬殊场(德国7:1、加拿大6:0、瑞士4:1、墨西哥2:0)模型多选客队受让覆盖却被主队大胜打穿,提示对顶级favorite的净胜球上限封顶过严。偏差:悬殊对阵中favorite净胜球被低估(maxSupremacy封顶导致多场大胜未被覆盖);大小球高概率档偏乐观,低比分闷平/0:0概率被低估;让球整体校准良好,概率略偏保守(命中率高于平均概率),无需激进调整
maxSupremacy2.5→2.7 — 多场顶级favorite主场大胜(7:1/6:0/4:1)时模型给出客队受让覆盖却落空,说明悬殊场净胜球被封顶过紧;小幅上调让强队让球更接近真实分布,仅影响极端mismatch场,不动中庸盘口。样本小,仅+0.2。rho-0.12→-0.13 — 样本中出现较多0:0与1:1,且高概率大球频繁落空;略微下调rho增加低比分(尤其0:0/1:1)的概率质量,温和缓解大球乐观偏差,改善大小球校准而不大幅改变期望进球量。 - 41场样本中,让球方向命中约70%但平均预测概率仅~0.55,呈轻度欠自信(多半为小样本运气,不宜大动);大小球方向整体仅~56%命中且高置信over(0.65-0.73)多次撞上0:0/1:1闷平,显示大球系统性偏乐观;此外强队大胜(6:0、7:1、4:1)超出supremacy上限,导致几次误选客队受让。偏差:大小球预测偏乐观,尤其强弱对话中的高置信over明显高估进球;低比分/平局质量(0:0、1:1)被低估,Dixon-Coles相关修正不足;强favorite的让球被maxSupremacy压制,blowout场次偏向错误的客队受让;让球预测概率整体偏保守(命中高于预测),但样本小,按校准而非命中率谨慎处理
rho-0.12→-0.14 — 实际多次出现0:0、1:1等低比分平局,增大低分相关修正可提升这些格的概率质量,温和压制大球过度乐观,改善Brier校准marketBlendWeight0.65→0.68 — 高置信over与部分让球出现过自信迹象,略增对去水盘口的锚定权重以收敛概率、改善校准,小步调整maxSupremacy2.5→2.7 — 多场强队大胜(6:0/7:1)超出当前上限,适度放宽可减少强favorite场次误选客队受让的系统性偏差,幅度保守