论文总结
A1 AlphaQCM
A1 AlphaQCM
《AlphaQCM: Alpha Discovery in Finance with Distributional Reinforcement Learning》
香港大学朱柯等为解决量化因子Alpha发现的马尔可夫决策过程中的非平稳性与奖励稀疏性,提出了AlphaQCM分布式强化学习框架,采用分位数条件矩方法QCM学习奖励的无偏方差以作为探索环境的额外奖励,融合用于分位数学习的IQN主干网络与用于Q值近似的DQN算法,提高搜索协同公式化Alpha能力,在大规模复杂市场数据下表现突出。
A2 LOB-Bench
A2 LOB-Bench
《LOB-Bench: Benchmarking Generative AI for Finance - an Application to Limit Order Book Data》
Peer Nagy等为评估生成的限价订单簿(LOB)数据的质量和真实性,提出了LOB-Bench评估框架与开源软件包。该框架采用基于分布比较,通过定义一系列评分函数将高维数据映射到一维标量,并计算其经验分布与真实分布之间的差异来全面评估模型。并在测试中发现发现自回归生成式人工智能方法的表现优于传统模型类别。
A3 e-GAI
A3 e-GAI
《e-GAI: e-value-based Generalized α-Investing for Online False Discovery Rate Control》
海交通大学数学科学学院任好洁等人针对在线多重假设检验中传统方法受限于特定依赖结构、且检验效能不足的问题,提出了基于e-值的广义α‑投资框架e‑GAI。该框架引入风险规避投资策略与动态α财富分配机制,克服了广义α‑投资的依赖局限性,同时提升了e‑LOND因固定递减序列导致的低效问题。实验显示,在复杂依赖下,e‑GAI衍生的e‑LORD与e‑SAFFRON在控制错误发现率的同时,检验效能显著优于e‑LOND。通过构建新的错误发现比例估计器并将框架扩展至条件超均匀p‑值,e‑GAI增强了理论普适性与实用价值。未来可进一步优化原假设比例估计方法,并探究依赖结构与错误发现估计之间的关系,以提升检验策略的精度与效率。
A4 Beyond CVaR
A4 Beyond CVaR
《Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning》
Hyejin Ku等针对在线风险敏感决策中传统风险度量(如CVaR)存在的策略保守、时间不一致与可解释性差的问题,Moghimi和Ku提出了基于静态谱风险度量的分布强化学习框架QR-SRM。该框架采用双循环优化与动态风险偏好分解机制,克服了已有方法在理论清晰度与策略最优性上的局限。实验表明,QR-SRM在多种高风险环境下,其风险调整后的决策效能显著优于主流基线。通过将谱风险度量表达为CVaR的凸组合,并结合分布回报与风险分解定理,该工作提升了风险敏感策略的表达能力与可解释性。未来研究可扩展至连续动作空间,并优化回报分布估计与风险偏好收敛机制。
A5
A5
《Latent Variable Estimation in Bayesian Black-Litterman Models》
消除贝叶斯布莱克-利特曼(BL)资产配置模型对于投资者主观观点的依赖。
捕捉特征与收益率之间的相互作用:共享潜变量参数化和特征影响观点;
将BL模型转化为一个完全数据驱动、无需主观观点、且内在一致的贝叶斯资产配置框架。
A6 HyperIV
A6 HyperIV
《HyperIV: Real-time Implied Volatility Smoothing》
实时隐含波动率平滑方法
采用一个超网络来为一个小型神经网络生成参数
保持计算效率的同时,实现了更高的准确性。该模型还表现出强大的跨资产泛化能力
B1 TimeBridge
《TimeBridge: Non-Stationarity Matters for Long-term Time Series Forecasting 》
ICML Poster TimeBridge: Non-Stationarity Matters for Long-term Time Series Forecasting
多元时间序列预测-非平稳性-依赖关系
弥合长期时间序列预测中非平稳性与依赖关系建模之间的鸿沟
非平稳性对短期和长期建模的不同影响
消除非平稳性对于避免伪回归和捕捉短期建模中的局部依赖关系
保留它对于揭示跨变量的长期协整关系
将输入序列分割成更小的片段,TimeBridge应用积分注意力来减轻短期非平稳性并捕获每个变量内的稳定依赖关系,同时应用协整注意力来保留非平稳性以建模跨变量的长期协整关系
B2 TimeStacker
《TimeStacker: A Novel Framework with Multilevel Observation for Capturing Nonstationary Patterns in Time Series Forecasting》
ICML Poster TimeStacker: A Novel Framework with Multilevel Observation for Capturing Nonstationary Patterns in Time Series Forecasting
Primary Area: Deep Learning->Sequential Models, Time series
主要研究领域:深度学习——>序列模型,时间序列
Keywords: deep learning, time series forecasting, non-stationarity, attention
关键词:深度学习,时间序列预测,非平稳性,注意力
时间序列预测-非平稳性
克服现有模型在捕捉非平稳信号特征方面的局限性
独特的堆叠机制-捕获全局信号特征,挖掘局部细节
集成了基于频率的自注意力模块,增强特征建模能力
预测精度卓越,而且在参数更少、计算效率更高方面展现出显著优势。
B3 CN-Diff
《Conditional Diffusion Model with Nonlinear Data Transformation for Time Series Forecasting》
ICML Poster Conditional Diffusion Model with Nonlinear Data Transformation for Time Series Forecasting
Keywords: diffusion model, time series forecasting, generative modeling扩散模型,时间序列预测,生成式建模
时间序列预测-带非线性数据变换的条件扩散模型
在扩散过程的前向阶段引入了新颖的非线性变换与可学习的条件机制
新的训练损失函数
增强了扩散模型捕获复杂时间序列模式的能力,简化了反向过程
学习一个高效的先验分布,同时也缩小了真实负对数似然与其变分近似之间的差距
CN-Diff 在九个真实世界数据集上的表现优于其他领先的时间序列模型
C1 MarS
《MarS: a Financial Market Simulation Engine Powered by Generative Foundation Model》
https://iclr.cc/virtual/2025/poster/29246
Keywords: Financial Market Simulation, Generative Foundation Model, Large Market Model (LMM), Controllable Simulation, Interactive Simulation, Market Impact, Reinforcement Learning, Forecasting, Market Manipulation Detection, Order-Level Data关键词:金融市场仿真,生成式基础模型,大市场模型,可控仿真,交互仿真,市场影响,强化学习,预测,市场操纵行为检测,订单级数据
订单级的金融市场模拟引擎-生成式基础模型
生成真实、可交互且可控的订单
关键的观察结果包括:LMM在数据规模和模型复杂性方面表现出强大的可扩展性,以及MarS在具有市场影响的受控生成中展现出稳健且实用的真实性
预测工具、检测系统、分析平台和智能体训练环境
C2
《Operator Deep Smoothing for Implied Volatility》
https://iclr.cc/virtual/2025/poster/32104
Keywords: Financial Engineering, Neural Operators, Option Pricing, Function Interpolation, Nowcasting
基于神经算子的隐含波动率,隐含波动率平滑
根据给定期权市场当前观测到的价格,构建一个与之相符的光滑曲面
大型历史数据集进行泛化的努力一直因需要大量的数据预处理而受阻
基于神经网络的策略、传统的参数化策略,隐含波动率平滑——逐例手动处理
算子深度平滑方法能够将观测数据直接映射到平滑曲面
图神经算子架构,在十年期标普500期权原始日内数据上,仅使用单一模型实例,便实现了高精度映射
C3 InvestESG
《InvestESG: A multi-agent reinforcement learning benchmark for studying climate investment as a social dilemma》
https://iclr.cc/virtual/2025/poster/31135
多智能体强化学习 (MARL) 基准测试模型
研究环境、社会和治理 (ESG) 信息披露强制令对企业气候投资的影响
模拟了一个跨期社会困境
多智能体强化学习通过高效测试替代性政策和市场设计方案,从而为理解大规模社会经济挑战、为政策制定提供参考的潜力
D1 DeepFund
《Time Travel is Cheating: Going Live with DeepFund for Real-Time Fund Investment Benchmarking》
https://neurips.cc/virtual/2025/loc/san-diego/poster/121642
大型语言模型在管理复杂基金投资方面的实际效果仍未得到充分评估
评估LLM驱动交易策略的基准测试的一个根本局限在于其依赖历史回测,这无意中使LLMs能够进行"时间旅行"——利用其训练语料库中蕴含的未来信息,从而导致潜在的信息泄露和过于乐观的性能估计
DeepFund,一个实时的基金基准测试工具,旨在实时市场条件下严格评估LLM
多智能体架构,直接连接实时股票市场数据——特别是每个模型预训练截断点之后发布的数据——以确保公平且无信息泄露的评估。
D2 PHANTOM
《PHANTOM: A Benchmark for Hallucination》
https://neurips.cc/virtual/2025/loc/san-diego/poster/121830
金融长上下文问答中幻觉检测的基准测试
先生成一个高质量的“查询-答案-文档(片段)”三元组种子数据集,其中的答案要么是幻觉生成的,要么是正确的——这些数据经过人工标注者的验证,随后被扩展以捕捉不同的上下文长度和信息位置。
PHANTOM对幻觉检测模型进行公平比较,并提供对LLM性能的深入洞察
基准测试结果突显了现成的模型在检测长上下文数据上的真实世界幻觉时所面临的严峻挑战
D3
《Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets》
https://neurips.cc/virtual/2025/loc/san-diego/poster/118821
金融市场中的鲁棒强化学习:利用椭圆不确定集建模市场冲击
传统的鲁棒RL方法通过在一系列不确定性上优化最坏情况性能来解决这种模型设定错误,但通常依赖对称性结构,未能捕捉市场冲击的方向性特征
椭圆不确定集。我们为这些集合下的最坏情况不确定性建立了隐式和显式的闭式解,从而实现了高效且易处理的鲁棒策略评估。
D4 TwinMarket
《TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets》
https://neurips.cc/virtual/2025/loc/san-diego/poster/116676
金融建模
一种可扩展的金融市场行为与社会仿真框架
基于规则的代理模型(ABMs),难以捕捉人类行为的多样性和复杂性,尤其是行为经济学所强调的非理性因素
多智能体框架
用LLM来模拟社会经济系统
探究个体行为如何通过互动和反馈机制,产生集体动态与涌现现象
模拟股票市场环境——展示了个人行为如何触发群体行为,并导致如金融泡沫和衰退等涌现结果
理解个体决策与集体社会经济模式之间复杂的相互作用
D5 CM-TDP
《Transfer Faster, Price Smarter: Minimax Dynamic Pricing under Cross-Market Preference Shift》
https://neurips.cc/virtual/2025/loc/san-diego/poster/116778
跨市场偏好转移下的Minimax动态定价
情境化动态定价问题
目标市场可以利用K个辅助市场——离线日志或并发数据流——其平均效用存在结构化的偏好差异
跨市场迁移动态定价(CM-TDP)算法
首个能够严格处理此类模型偏移迁移并为线性和非参数效用模型均提供minimax最优后悔界的算法
D6
《Matching Markets Meet LLMs: Algorithmic Reasoning with Ranked Preferences》
https://neurips.cc/virtual/2025/loc/san-diego/poster/120182
D7
《Smooth Quadratic Prediction Markets》
https://neurips.cc/virtual/2025/loc/san-diego/poster/117036
D8
《Near-Optimal Regret-Queue Length Tradeoff in Online Learning for Two-Sided Markets》
https://neurips.cc/virtual/2025/loc/san-diego/poster/119649
https://neurips.cc/virtual/2025/loc/san-diego/papers.html?search=market