模型自学习

两层反馈让模型越用越准:确定性自动调参(用累积结果最小化 Brier)+ Claude Opus 智能分析(诊断偏差、补定性因素)。

Claude 智能反馈层

已启用 · claude-opus-4-8

ai-review 定时任务会复盘近期误差给出调参建议(待人工审核),并对未来比赛补充伤病/动机/天气等定性因素。

说明:Claude 不「训练/微调」统计模型(LLM 无法被这样训练);它负责分析与定性增强,真正的参数拟合由下方确定性引擎完成。

自动调参引擎（演示）

历史样本

8 场

调参前 Brier

0.2276

调参后 Brier

0.2079

Brier 0.2276 → 0.2079,已采用新参数

参数调整：

marketBlendWeight: 0.65 → 0.4
eloPerGoal: 100 → 125
attackDefenseWeight: 0.5 → 0.7
maxSupremacy: 2.5 → 3

这是在内置历史样本上的只读演示。线上由 auto-tune 定时任务在每批比赛结束后执行并写回生效参数。

当前生效参数

rho

-0.12

maxGoals

eloPerGoal

100

maxSupremacy

2.5

homeAdvantageGoals

0.25

attackDefenseWeight

0.5

marketBlendWeight

0.65

maxAvailabilityPenalty

0.25

noXgConfidencePenalty

0.15

contrarianThreshold

0.5

confidenceScale

调参日志

2026-06-22 21:400.2355 → 0.2355保持
2026-06-22 21:300.2355 → 0.2355保持
2026-06-22 20:370.2355 → 0.2355保持
2026-06-22 20:240.2433 → 0.2355已采用

Claude 调参建议（待审核）

41场样本中让球方向命中率约73%、整体可用,但大小球'大球'在高置信区间(≥0.7)严重过自信——C2/E4/H1/K1等0.7+大球落到0:0、0:1、1:1,7个高置信大球仅命中3个;同时B4(6:0)、E1(7:1)、F3(5:1)等强队大胜的让球被低估。说明进球分布右尾被高估、低比分与平局质量被压低,强队让球上限偏紧。
偏差：大小球高置信区间偏乐观、过自信(高估大球与进球右尾)；低比分/平局质量被低估(多场0:0、1:1未被充分预期)；强队大胜场次让球受supremacy上限压制、略有低估；让球整体反而略偏欠自信(命中率高于平均报价概率,样本噪声大)
marketBlendWeight 0.65→0.7 — 高置信大球系统性失准,向去水盘口多收敛可压缩极端大球概率、改善校准;againstMarket全为false,加权市场风险低。
rho -0.12→-0.08 — 实际出现大量0:0/1:1/平局而高置信大球频繁落空,负rho过度压低了低比分相关性;向0小幅回调可增加低分与平局质量、缓解大球乐观偏差。
maxSupremacy 2.5→2.7 — 6:0、7:1、5:1等强队大胜导致让弱队一侧落空,当前supremacy上限对顶级强弱对抗略紧,小幅放宽以更好覆盖大分差;小步以防过拟合小样本。
41场样本中让球表现稳健(约73%命中,概率多压在0.52-0.60区间,校准良好甚至略显保守);主要问题在大小球:高概率大球档(0.65-0.73)多次落空(H1、E4、K1、C2),且多场以0:0/1:1闷平收场,整体大球略偏乐观。此外在极端强弱悬殊场(德国7:1、加拿大6:0、瑞士4:1、墨西哥2:0)模型多选客队受让覆盖却被主队大胜打穿,提示对顶级favorite的净胜球上限封顶过严。
偏差：悬殊对阵中favorite净胜球被低估(maxSupremacy封顶导致多场大胜未被覆盖)；大小球高概率档偏乐观,低比分闷平/0:0概率被低估；让球整体校准良好,概率略偏保守(命中率高于平均概率),无需激进调整
maxSupremacy 2.5→2.7 — 多场顶级favorite主场大胜(7:1/6:0/4:1)时模型给出客队受让覆盖却落空,说明悬殊场净胜球被封顶过紧;小幅上调让强队让球更接近真实分布,仅影响极端mismatch场,不动中庸盘口。样本小,仅+0.2。
rho -0.12→-0.13 — 样本中出现较多0:0与1:1,且高概率大球频繁落空;略微下调rho增加低比分(尤其0:0/1:1)的概率质量,温和缓解大球乐观偏差,改善大小球校准而不大幅改变期望进球量。
41场样本中,让球方向命中约70%但平均预测概率仅~0.55,呈轻度欠自信(多半为小样本运气,不宜大动);大小球方向整体仅~56%命中且高置信over(0.65-0.73)多次撞上0:0/1:1闷平,显示大球系统性偏乐观;此外强队大胜(6:0、7:1、4:1)超出supremacy上限,导致几次误选客队受让。
偏差：大小球预测偏乐观,尤其强弱对话中的高置信over明显高估进球；低比分/平局质量(0:0、1:1)被低估,Dixon-Coles相关修正不足；强favorite的让球被maxSupremacy压制,blowout场次偏向错误的客队受让；让球预测概率整体偏保守(命中高于预测),但样本小,按校准而非命中率谨慎处理
rho -0.12→-0.14 — 实际多次出现0:0、1:1等低比分平局,增大低分相关修正可提升这些格的概率质量,温和压制大球过度乐观,改善Brier校准
marketBlendWeight 0.65→0.68 — 高置信over与部分让球出现过自信迹象,略增对去水盘口的锚定权重以收敛概率、改善校准,小步调整
maxSupremacy 2.5→2.7 — 多场强队大胜(6:0/7:1)超出当前上限,适度放宽可减少强favorite场次误选客队受让的系统性偏差,幅度保守