4月8日,上海浦东的量化实验室里,中央空调发出低频嗡鸣,环形屏幕将3276个因子代码投射成流动的星群。陈默站在中央控制台前,看着林语晨滑动鼠标,夏普比率曲线在屏幕左侧如心电图般跳动,某动量因子的十年回测曲线在2017年6月2日处垂直坠落,犹如悬崖边的失事缆车。
“动量因子在2014-2016年的夏普比率高达2.1,”林语晨的指尖在曲线峰值处停顿,指甲修剪得短而整齐,“但在2017年5月的‘漂亮50’行情中,单月回撤达42%,胜率从65%暴跌至32%。”她的声音像手术刀划开皮肤,冷静得近乎残酷,“这不是因子失效,是市场从‘动量主导’相变到‘价值主导’,而因子没有随之进化。”
技术总监小李调出分年度回测报告,不同年份的胜率数据在屏幕上切换:2015年牛市65%,2016年震荡市48%,2017年蓝筹市32%。“那年监管层限制高送转和杠杆资金,”他的鼠标在政策文件图标上划过,“游资退场导致动量策略失灵,传统因子库缺乏政策敏感度。”
陈默盯着屏幕上褪色的“市盈率”因子,其信息系数在2020年后持续低于0.1,宛如暮年武士的锈剑。林语晨在白板上写下夏普比率公式,粉笔灰落在“过拟合”三个字周围:“夏普比率是静态后视镜,”她用粉笔敲击公式中的波动率项,“而市场是动态河流,因子需要能识别水流方向的罗盘。”
午后14:00,第一轮筛选结果出炉,大屏幕上的因子数量从3276锐减至397,红色淘汰名单如鲜血般铺满90%的画面。小李指着“twitter情绪熵”因子,其信息系数曲线在0.03附近波动,像一条濒死的直线:“IcIR仅0.8,低于1.0的最低标准,而且数据来源是境外社交媒体,合规风险极高。”
林语晨调出2020年GmE逼空事件的分时图,社交媒体热度曲线在股价暴涨前三日出现陡峭峰值:“看这里,因子在散户抱团前72小时发出预警,”她的鼠标圈住情绪熵的正偏离区域,“传统Ic计算给极端事件的权重不足1%,这是线性思维的致命盲区。”
陈默调出因子矩阵,“订单流不平衡度”因子在暗池交易时段的信息系数突然归零:“暗池数据延迟100毫秒,”他的手指在时间轴上划出红色线段,“在高频环境中,100毫秒足以让机构完成5次拆单和撤单,因子捕捉到的只是滞后的噪音。”
林语晨的眉头微蹙,调出暗池交易占比数据:“2025年一季度,暗池交易占A股总量的18.7%,”她的目光扫过服务器机柜,“我们的模型假设暗池与公开市场同质,但冰山委托的平均拆单规模已从500手降至200手。”
“冰山委托会伪装成散户,”小李突然插话,调出某医药股的暗池订单,“10万手卖单拆分为500笔200手委托,传统量能因子会误判为散户换手,实际是机构出货。”
当测试到“涨停后三日量能萎缩”模式时,系统突然弹出红色报错窗口,字体大小比平时大了2号:“暗池订单误判率超25%,建议暂停测试。”林语晨快速敲击键盘,冰山委托识别模块的错误日志如瀑布般刷屏:“算法将73%的冰山订单归类为散户,导致量能因子低估真实抛压。”
陈默在操盘日志写下:“因子筛选不仅是数学游戏,更是对市场生态的认知重构。”他划掉“游戏”,改为“战争”,笔尖将纸张戳出微小破洞。墨迹在纸背洇开,像极了暗池中隐藏的风险。
凌晨2点,团队围坐在会议桌前,屏幕上的因子列表只剩127个,宛如战场上的幸存者。林语晨的声音带着硅谷式的疲惫:“保留的因子中,传统因子62个,新型因子65个,”她调出实盘测试方案,“明天接入暗池实时数据,模拟交易将启用微秒级时间切片。”
小李终于说出担忧:“暗池数据涉及未公开订单,证监会2024年第56号文明确要求...”
“风险与收益共生,”陈默打断他,目光投向窗外的黄浦江,陆家嘴的灯光倒映在江面,像碎掉的LEd屏幕,“2019年我爆仓时,就是因为回避了当时的‘创新风险’——暗池是未来,也是战场。”
林语晨收拾笔记本电脑,银色戒指在灯光下闪烁,戒面的二进制代码隐约可见:“暗池没有K线,只有订单流的尸体,”她的声音低沉,“我们的因子必须学会在尸体堆里找生存机会。”
陈默望着屏幕上跳动的因子代码,想起林语晨实验室里的FpGA芯片——那些蓝光闪烁的芯片,像极了暗池中等待猎物的电鳗。他知道,当明天暗池数据接入的那一刻,这些因子将经历真正的战火洗礼,而他作为指挥官,必须在合规与创新的钢丝上,走出一条属于中国量化的生存之道。