翻译《在Polymarket上交易所需的数学知识(完整路线图)》
Polymarket交易所需的数学知识(完整路线图)
我将详细拆解在Polymarket交易所需的核心数学知识,并分享帮助我入门的具体学习路径和资源。
让我们直入主题。
最近一篇研究论文揭示了真相:成熟的交易员一年内从Polymarket套取了4000万美元的确定性套利利润。排名首位的交易员独赚 $2,009,631.76。这些人不是靠运气赌博的赌徒。他们运行的是 Bregman投影、Frank-Wolfe算法,以及解决足以让大多数计算机科学博士感到不适的优化问题。
收藏本文 — 我是Roan,一名后端开发工程师,专注于系统设计、高频交易风格的执行系统和量化交易系统。我的工作重点是研究预测市场在负载下的实际行为表现。
当你看到一个市场中"是"(YES)报价$0.62、“否”(NO)报价$0.33时,你会想"加起来是$0.95,存在套利机会"。你说得对。但大多数人从未意识到的是:当你还在手动检查 YES + NO 是否等于 $1 时,量化系统已经在毫秒级时间内求解整数规划问题,扫描17,218个条件跨越 种可能的结果。当你的人工双订单还未完成,价差已经消失。系统早已在数十个相关市场中发现了同样的价格偏离,计算了考虑订单簿深度和手续费的最优仓位规模,执行了并行非原子交易,并将资金轮转到了下一个机会。
差异不仅仅是速度,而是数学基础设施。
阅读完本文,你将理解那套从Polymarket套取4000万美元的确切优化框架。你会明白为什么简单的加法行不通,整数规划如何压缩指数级搜索空间,以及Bregman散度(Bregman divergence)对定价效率的实际意义。更重要的是,你将看到区分业余项目与运行数百万资金的生产系统的具体代码模式和算法策略。
注意:这不是一篇可以略读的文章。如果你真心想搭建能扩展到七位数规模的系统,请通读全文。如果你只想找快速致富的捷径或"氛围编程",本文不适合你。
第一部分:边际多面体问题(为什么简单数学会失效)
多条件市场的现实
单一条件市场:“特朗普会赢得宾夕法尼亚州吗?”
- YES: $0.48
- NO: $0.52
- 总和: $1.00
看起来完美无缺,没有套利,对吧?
错了。
现在加入另一个市场:“共和党会以5+优势赢得宾夕法尼亚州吗?”
- YES: $0.32
- NO: $0.68
两者总和仍为$1,看起来依然正常。
但这里存在逻辑依赖关系。如果共和党以5+优势获胜,特朗普必然赢得宾夕法尼亚州。这些市场并非独立。而这正是套利的来源。
数学框架
对于具有 个条件的市场,存在 种可能的价格组合。但只有 种有效结果,因为恰好有一个条件必须解析为TRUE。
定义有效收益向量集合:
其中 是一个二元向量,表示在结果 中哪个条件为TRUE。
边际多面体(Marginal Polytope)是这些有效向量的凸包:
可以简单理解为把 里的所有有效向量 “包起来” 的一个封闭区域(比如 2 个向量的凸包是连接这两个点的线段,3 个向量的凸包是三角形)
无套利价格必须位于 内。任何在 外的价格都是可利用的。
市场的实际定价必须落在这个「凸包区域 」内 —— 因为凸包的边界是由「真实有效结果」决定的,代表了价格的合理区间;如果价格落在 外,就说明定价偏离了真实结果,存在无风险套利空间(即 “可利用的价格”)。
以宾夕法尼亚州为例:
- 市场A有2个条件,2种有效结果
- 市场B有2个条件,2种有效结果
- 朴素组合检查: 种可能结果
- 实际有效结果:3种(依赖关系消除了1种)
当价格假设存在4种独立结果而实际只有3种时,错误定价就创造了确定性利润。
为什么暴力枚举会失效
2010年NCAA锦标赛市场:
- 63场比赛(每场胜负)
- 种可能结果
- 5,000+ 个证券
检查每一种组合在计算上是不可能的。
研究团队发现,仅2024年美国大选就有1,576对潜在依赖市场。朴素的两两验证需要为每对检查 种组合。
每个市场仅10个条件,就是每对 次检查。乘以1,576对。当你的笔记本电脑还在计算时,选举结果已经公布了。
整数规划解决方案
与其枚举结果,不如用线性约束描述有效集合:
杜克大学 vs 康奈尔大学的真实案例: 每队有7个证券(0到6胜)。共14个条件, 种可能组合。
但他们不可能都赢5+场比赛,因为他们会在半决赛相遇。
整数规划约束:
约束 1:
- 翻译:杜克的 7 个证券(0-6 胜),恰好有且只有 1 个生效。
- 作用:剔除杜克 “同时赢 2 场以上”“一场都没赢(但也没生效)” 等无效组合 —— 比如 且 ,直接不满足这个约束,被剔除。
- 单这一条,就把杜克的组合数从 种砍到7 种(只能选一个胜场数)。
约束 2:
- 翻译:康奈尔的 7 个证券(0-6 胜),恰好有且只有 1 个生效。
- 作用:和约束 1 同理,把康奈尔的组合数从 128 种砍到7 种。
- 约束 1+2 结合,原本 16384 种组合,直接砍到种(杜克 7 种 × 康奈尔 7 种),计算量大幅降低。
约束 3:
- 翻译:杜克赢 5/6 场 或 康奈尔赢 5/6 场,最多只有一个情况能发生(也可以都不发生)。
- 核心原因:两队半决赛相遇,赢 5 + 场意味着要打进决赛 / 夺冠,但半决赛只能有一队晋级,不可能两队都走到 5 + 场的阶段。
- 作用:在 49 种组合里,再剔除「杜克 5+/ 康奈尔 5+」「杜克 5+/ 康奈尔 6+」「杜克 6+/ 康奈尔 5+」「杜克 6+/ 康奈尔 6+」这 4 种完全不可能的无效组合,最终只剩 45 种真实有效组合。
三个线性约束替代了16,384次暴力检查。
这就是量化系统处理指数级复杂性的方式:不是枚举,而是约束。
真实数据的检测结果
研究团队分析了2024年4月至2025年4月的市场数据:
- 检查了17,218个总条件
- 7,051个条件显示单市场套利(41%)
- 中位错误定价:$0.60/美元(应为$1.00)
- 13对确认依赖市场存在可利用套利
中位错误定价$0.60意味着市场经常偏离40%。远非有效,而是大规模可利用。
关键要点:套利检测不是检查数字是否相加。它是关于使用紧凑线性表示在指数级大的结果空间上求解约束满足问题。
第二部分:Bregman投影(如何真正消除套利)
发现套利是一个问题。计算最优套利交易是另一个问题。
你不能仅仅通过平均或微调数字来"修复"价格。你需要将当前市场状态投影到无套利流形上,同时保留信息结构。
为什么标准距离会失效
欧几里得投影会最小化:
这同等对待所有价格变动。但市场使用成本函数。价格从$0.50到$0.60的变动,与从$0.05到$0.15的变动,信息含量不同,尽管都是10美分的变化。
| 价格变动 | 数值差 | 概率变化的实际含义 | 信息含量 / 市场影响 |
|---|---|---|---|
| 0.50→0.60 | +0.10 | 概率从 50%→60%,上升 20%(相对变化:0.10/0.50=20%) | 普通变动,市场对事件发生的信心小幅提升,信息含量低 |
| 0.05→0.15 | +0.10 | 概率从 5%→15%,上升 300%(相对变化:0.10/0.05=300%) | 剧烈变动,市场对 “原本几乎不可能的事” 突然产生信心,信息含量极高 |
做市商使用对数成本函数(LMSR,Logarithmic Market Scoring Rule),其中价格代表隐含概率。正确的距离度量必须尊重这种结构。
Bregman散度
对于任何凸函数 及其梯度 ,Bregman散度为:
其中:
- 是成本函数 的凸共轭
- 是当前市场状态
- 是目标价格向量
- 是做市商成本函数
对于LMSR, 是负熵:
这使得 成为KL散度(Kullback-Leibler divergence),度量概率分布间的信息论距离。
KL散度核心特性:
- 非对称:,匹配市场定价的实际 ——“从低概率 0.05 调到 0.15” 和 “从 0.15 调回 0.05”,成本 / 信息影响完全不同,欧几里得距离是对称的(无法区分);
- 放大极端区间差异:相同的数值差,在 0.05/0.95 等极端概率区间,KL 散度的计算结果会远大于中间区间(0.50 左右),完美匹配 “极端价格变动信息含量更高” 的市场规律;
- 非负性:,且只有当(当前 = 目标)时,散度为 0—— 符合 “距离非负” 的直觉,做市商只有定价完全匹配目标时,才不需要承担调整成本。
套利利润公式
任何交易的最大保证利润等于:
其中 是 在 上的Bregman投影。
这并不显然。证明需要凸对偶理论。但含义清晰:寻找最优套利交易等价于计算Bregman投影。
真实数据
顶级套利者一年内提取了$2,009,631.76。他们的策略是比其他人更快更准确地求解这个优化问题:
每一笔盈利交易都是在价格变动前找到 。
为什么这对执行很重要
当你检测到套利时,你需要知道:
- 建立什么头寸(买入/卖出哪些条件)
- 什么规模(考虑订单簿深度)
- 预期什么利润(考虑执行风险)
Bregman投影给你全部三个答案。
投影 告诉你无套利价格向量。散度 告诉你最大可提取利润。梯度 告诉你交易方向。
没有这个框架,你在猜测。有了它,你在优化。
关键要点:套利不是发现错误定价的资产。它是关于在市场微观结构定义的空间中求解约束凸优化问题。数学决定盈利能力。
第三部分:Frank-Wolfe算法(使其计算可行)
直接计算Bregman投影是不可行的。边际多面体 有指数级多的顶点。
标准凸优化需要访问完整约束集。对于预测市场,这意味着枚举每个有效结果。在大规模下不可能。
Frank-Wolfe算法通过将投影简化为一系列线性规划来解决这个问题。
核心洞见
Frank-Wolfe不是一次性优化整个 ,而是迭代构建它。
算法:
1. 从已知顶点的小集合 Z_0 开始
2. 对于迭代 t:
a. 求解 conv(Z_{t-1}) 上的凸优化
μ_t = argmin_{μ ∈ conv(Z_{t-1})} F(μ)
b. 通过求解IP找到新的下降顶点:
z_t = argmin_{z ∈ Z} ∇F(μ_t)·z
c. 添加到活跃集:
Z_t = Z_{t-1} ∪ {z_t}
d. 计算收敛间隙:
g(μ_t) = ∇F(μ_t)·(μ_t - z_t)
e. 如果 g(μ_t) ≤ ε 则停止活跃集 每迭代增长一个顶点。即使经过100次迭代,你也只追踪100个顶点,而不是 个。
整数规划预言机
第2b步是昂贵的部分。每次迭代需要求解:
其中 是当前梯度, 是由整数约束定义的有效收益向量集合。
这是一个整数线性规划(Integer Linear Program)。一般情况下是NP难的。但现代IP求解器如Gurobi对结构良好的问题能高效处理。
研究团队使用Gurobi 5.5。典型求解时间:
- 早期迭代(小部分结果确定):< 1秒
- 中期锦标赛(30-40场比赛确定):10-30秒
- 后期锦标赛(50+场比赛确定):< 5秒
为什么后期更快?因为随着结果确定,可行集缩小。变量更少,约束更紧,求解更快。
受控增长问题
标准Frank-Wolfe假设梯度 是Lipschitz连续的且有界常数。
对于LMSR,。当 趋近0时,梯度爆炸到负无穷。
这违反了标准收敛证明。
解决方案是Barrier Frank-Wolfe。不是在 上优化,而是在收缩多面体上优化:
其中 是所有坐标严格在0和1之间的内点, 是收缩参数。
对于任何 ,梯度在 上是有界的。Lipschitz常数为 。
算法自适应地随迭代减小 :
如果 g(μ_t) / (-4g_u) < ε_{t-1}:
ε_t = min{g(μ_t)/(-4g_u), ε_{t-1}/2}
否则:
ε_t = ε_{t-1}这确保 渐近趋于0,因此收缩问题收敛到真实投影。
收敛速度
Frank-Wolfe以 的速度收敛,其中 是Lipschitz常数, 是 的直径。
对于带自适应收缩的LMSR,这变为 。随着 自适应缩小,收敛变慢但仍保持多项式级。
研究表明,实践中50到150次迭代足以使数千条件的市场收敛。
生产性能
论文原文:“一旦投影变得实际快速,FWMM在准确性上优于LCMM。”
时间线:
- 前16场比赛:LCMM和FWMM表现相似(IP求解器太慢)
- 45场比赛确定后:首次成功的30分钟投影完成
- 剩余锦标赛:FWMM在证券价格上比LCMM中位数提升38%
交叉点是当结果空间缩小到IP求解能在交易时间框架内完成时。
关键要点:理论优雅若无计算可行性则毫无意义。带整数规划预言机的Frank-Wolfe使Bregman投影在具有万亿结果的市场上变得实用。这就是4000万美元套利实际被计算和执行的方式。
第四部分:非原子约束下的执行(为什么订单簿改变一切)
你已经检测到套利。你已经通过Bregman投影计算出最优交易。现在你需要执行。
这是大多数策略失败的地方。
非原子问题
Polymarket使用中央限价订单簿(CLOB)。与套利可以是原子性的去中心化交易所(所有交易同时成功或失败)不同,CLOB执行是顺序的。
你的套利计划:
买入YES @ $0.30
买入NO @ $0.30
总成本: $0.60
保证赔付: $1.00
预期利润: $0.40现实:
提交YES订单 → 以$0.30成交 ✓
价格因你的订单更新
提交NO订单 → 以$0.78成交 ✗
总成本: $1.08
赔付: $1.00
实际结果: -$0.08亏损一条腿成交了。另一条没有。你暴露了风险。
这就是为什么研究论文只计算至少有$0.05利润边际的机会。更小的价差会被执行风险吞噬。
成交量加权平均价格(VWAP)分析
与其假设以报价即时成交,不如计算预期执行价格:
研究方法:
对于Polygon的每个区块(约2秒):
计算该区块所有YES交易的VWAP_yes
计算该区块所有NO交易的VWAP_no
如果 |VWAP_yes + VWAP_no - 1.0| > 0.02:
记录套利机会
利润 = |VWAP_yes + VWAP_no - 1.0|区块是原子时间单位。按区块分析VWAP捕捉实际可达成价格,而非即时执行的幻想。
流动性约束
即使价格错误定价,你只能捕捉到可用流动性范围内的利润。
数据中的真实案例:
- 市场显示套利:YES价格总和 = $0.85
- 潜在利润:$0.15/美元
- 这些价格的订单簿深度:$234总成交量
- 最大可提取利润:$234 × 0.15 = $35.10
研究计算每次机会的最大利润为:
对于多条件市场,你需要所有头寸同时有流动性。最小值决定你的上限。
时间窗口分析
研究采用 950 个区块的窗口期(约 1 小时)对关联交易进行分组。
为何选择 1 小时?因为 Polymarket 上 75% 的撮合订单在此时间窗口内完成成交。提交、撮合并上链执行的订单,通常能在 60 分钟内全部完成。
对于每个交易者地址,950 个区块窗口期内的所有出价被归并为单次策略执行。利润计算方式为:所有可能结果中的保证最低赔付额减去总成本。
执行成功率
在检测到的套利机会中:
| 套利类型 | 执行情况 |
|---|---|
| 单条件套利 | 41% 的条件存在机会,其中大部分被成功利用 |
| 市场再平衡 | 42% 的多条件市场存在机会 |
| 组合套利 | 识别出 13 对有效组合,仅 5 对实际执行 |
检测与执行之间的差距,即为执行风险。
延迟层级:速度层次结构
散户交易执行:
Polymarket API调用: ~50ms
撮合引擎: ~100ms
Polygon出块时间: ~2,000ms
区块传播: ~500ms
总计: ~2,650ms成熟套利系统:
WebSocket价格流: <5ms (实时推送)
决策计算: <10ms (预计算)
直接RPC提交: ~15ms (绕过API)
并行执行: ~10ms (所有腿同时)
Polygon区块包含: ~2,000ms (不可避免)
总计: ~2,040ms链上看到的20-30ms是决策到内存池的时间。快速钱包在30ms内提交所有头寸,通过在同一区块中确认所有交易来消除顺序执行风险。
复利优势
当你在第N区块看到他们的交易确认时,他们在2秒前(第N-1区块)就检测到了机会,30ms内提交了所有腿,市场已经重新平衡。当你在第N+1区块复制时,你比亚秒级机会落后了4秒。
为什么复制快钱包会失败
实际发生的情况:
第N-1区块:快速系统检测到错误定价,30ms内提交4笔交易
第N区块:所有交易确认,套利完成,你看到这笔交易
第N+1区块:你复制他们的交易,但价格现在是$0.78(之前是$0.30)你不是在套利。你是在提供退出流动性。
订单簿深度杀死你:
快钱包买入50,000代币:
- VWAP:跨多个价格层级$0.322
- 市场移动
你之后买入5,000代币:
- VWAP:$0.344(市场已移动)
- 他们支付$0.322,你支付$0.344
- 他们的10美分价差变成了你的2.2美分亏损
资本效率问题
顶级套利者以$500K+资本运营。用$5K资本,同样的策略就行不通了,原因是:
- 滑点对较小头寸占更大百分比
- 无法分散到足够多机会
- 单次失败执行 wiping out 数日利润
- 固定成本(gas)消耗更多利润边际
4腿策略的Gas费:~$0.02
- $0.08利润 → 25%归gas
- $0.03利润 → 67%归gas
这就是$0.05最低阈值存在的原因。
真实执行数据
单条件套利:
- 检测到:7,051个条件
- 执行:87%成功率
- 失败原因:流动性(48%)、价格变动(31%)、竞争(21%)
组合套利:
- 检测到:13对
- 执行:45%成功率
- 失败原因:同时流动性不足(71%)、速度竞争(18%)
关键要点:数学正确性是必要但不充分的。执行速度、订单簿深度和非原子成交风险决定实际盈利能力。研究显示4000万美元被提取,因为成熟参与者解决了执行问题,而不仅仅是数学问题。
第五部分:完整系统(实际部署的内容)
理论是简洁的,而实际生产则是复杂的。以下是基于研究结果和实际需求的一个可行套利系统的真实面貌。
数据管道
实时需求:
WebSocket连接到Polymarket CLOB API
└─ 订单簿更新(价格/成交量变化)
└─ 交易执行流(正在发生的成交)
└─ 市场创建/结算事件
历史分析:
Alchemy Polygon节点API
└─ 查询合约0x4D97DCd97eC945f40cF65F87097ACe5EA0476045的事件
└─ OrderFilled事件(已执行的交易)
└─ PositionSplit事件(新代币铸造)
└─ PositionsMerge事件(代币销毁)研究分析了8600万笔交易。这种量级需要基础设施,而非脚本。
依赖检测层
对于305个美国大选市场,有46,360对需要检查。
人工分析不可能。研究使用DeepSeek-R1-Distill-Qwen-32B配合提示工程:
输入:两个市场及其条件描述
输出:有效结果组合的JSON
验证检查:
1. 每个市场是否每结果恰好一个TRUE条件?
2. 有效组合是否少于n×m(存在依赖)?
3. 依赖子集是否满足套利条件?
大选市场结果:
40,057对独立(无套利可能)
1,576对依赖(潜在套利)
374对满足严格组合条件
13对人工验证为可利用复杂多条件市场准确率81.45%。足以用于过滤。执行前需人工验证。
优化引擎
三层套利消除:
第一层:简单LCMM约束
快速线性规划松弛。检查基本约束如"概率总和等于1"和"如果A蕴含B,则P(A)不能超过P(B)"。
毫秒级运行。消除明显错误定价。
第二层:整数规划投影
带Gurobi IP求解器的Frank-Wolfe算法。
研究参数:
- Alpha = 0.9(提取至少90%可用套利)
- 初始epsilon = 0.1(10%收缩)
- 收敛阈值 = 1e-6
- 时间限制 = 30分钟(随市场缩小而减少)
典型迭代:50到150次。典型每次迭代求解时间:1到30秒,取决于市场规模。
第三层:执行验证
提交订单前,针对当前订单簿模拟成交。
检查:
- 这些价格是否有足够流动性?
- 预期滑点是多少?
- 滑点后保证利润是多少?
- 利润是否超过最低阈值(研究使用$0.05)?
只有所有检查通过才执行。
仓位规模逻辑
考虑执行风险的修正Kelly准则:
其中:
- = 套利利润百分比
- = 完全执行概率(从订单簿深度估计)
上限为订单簿深度的50%以避免移动市场。
监控仪表板
实时追踪:
每分钟检测到的机会
每分钟执行的机会
执行成功率
总利润(累计)
当前回撤百分比
平均延迟(检测到提交)
警报:
回撤超过15%
执行率低于30%
IP求解器超时增加
订单成交失败激增研究确定顶级套利者进行了4,049笔交易。一年内平均每天约11笔交易。不是传统意义上的高频,而是系统性和一致性。
实际结果
2024年4月至2025年4月总提取:
单条件套利:
双买 < $1: $5,899,287
双卖 > $1: $4,682,075
小计: $10,581,362
市场再平衡:
全买YES < $1: $11,092,286
全卖YES > $1: $612,189
全买NO: $17,307,114
小计: $29,011,589
组合套利:
跨市场执行: $95,634
总计: $39,688,585前10名提取者拿走$8,127,849(总计的20.5%)。
单一顶级提取者:4,049笔交易获得$2,009,632。
顶级玩家平均每笔交易利润:$496。
不是彩票中奖。不是幸运时机。数学精确性系统性执行。
赢家与输家的区别
研究明确显示:
散户方法:
- 每30秒检查价格
- 看看YES + NO是否大致等于$1
- 也许用个电子表格
- 人工提交订单
- 寄希望于最好
量化方法:
- 实时WebSocket流
- 整数规划检测依赖
- Frank-Wolfe配合Bregman投影寻找最优交易
- 带VWAP滑点估计的并行订单执行
- 执行约束下的系统性仓位规模
- 2.65秒延迟 vs. 30秒轮询
一组人提取了4000万美元。另一组人提供了流动性。
关键要点:生产系统需要数学严谨性和工程成熟度。优化理论、分布式系统、实时数据处理、风险管理、执行算法。全部都需要。数学是基础。基础设施使其盈利。
最终现实
当交易员还在阅读"预测市场10个技巧"时,量化系统正在:
- 求解整数规划以检测17,218个条件间的依赖关系
- 计算Bregman投影以寻找最优套利交易
- 运行带受控梯度增长的Frank-Wolfe算法
- 执行带VWAP滑点估计的并行订单
- 系统性提取4000万美元保证利润
差异不是运气。是数学基础设施。
研究论文是公开的。算法是已知的。利润是真实的。
问题是:你能在下一个4000万美元被提取前搭建出来吗?
资源:
- 研究论文:“Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets” (arXiv:2508.03474v1)
- 理论基础:“Arbitrage-Free Combinatorial Market Making via Integer Programming” (arXiv:1606.02825v2)
- IP求解器:Gurobi Optimizer
- 依赖关系LLM:DeepSeek-R1-Distill-Qwen-32B
- 数据源:Alchemy Polygon节点API
算法是可行的。基础设施也已存在。唯一的问题在于执行。