数据分层
2025-07-13
交易数据的逻辑来源与推演路径
交易数据的逻辑来源与推演路径
交易数据是市场活动的数字化映射,每一项数据都有其特定的逻辑来源。以下是从最基础的交易行为开始,推演出各类交易数据的逻辑路径:
1. 原始交易行为与基础数据
订单提交行为
- 原始行为:交易者向交易所提交买入或卖出订单
- 直接数据:
- 订单类型(市价单/限价单)
- 订单方向(买/卖)
- 订单价格(限价单)
- 订单数量
- 订单时间戳
- 交易者标识
订单匹配过程
- 原始过程:交易所撮合系统将买卖订单按规则配对
- 直接数据:
- 成交价格
- 成交数量
- 成交时间戳
- 交易双方标识
- 成交序号
订单管理行为
- 原始行为:交易者修改或取消未成交订单
- 直接数据:
- 订单修改记录
- 订单取消记录
- 订单生命周期时间
2. 一级衍生数据(直接聚合)
价格数据的逻辑来源
- 开盘价 = 特定时间段内第一笔成交的价格
- 最高价 = max(所有成交价格)
- 最低价 = min(所有成交价格)
- 收盘价 = 特定时间段内最后一笔成交的价格
- VWAP = ∑(成交价格 × 成交量) ÷ ∑(成交量)
成交量数据的逻辑来源
- 成交量 = ∑(所有成交数量)
- 成交笔数 = count(成交记录)
- 成交金额 = ∑(成交价格 × 成交量)
- 平均单笔成交量 = 总成交量 ÷ 成交笔数
订单簿数据的逻辑来源
- 买X价/卖X价 = 按价格排序的第X档未成交买/卖订单价格
- 买X量/卖X量 = 该价格档位的累计订单数量
- 买卖价差 = 卖一价 - 买一价
- 买卖量比 = ∑(买单量) ÷ ∑(卖单量)
3. 二级衍生数据(计算与分析)
变动指标的逻辑来源
- 价格变动 = 当前价格 - 前收盘价
- 涨跌幅 = (当前价格 - 前收盘价) ÷ 前收盘价
- 振幅 = (最高价 - 最低价) ÷ 前收盘价
- 换手率 = 成交量 ÷ 流通股本
交易方向指标的逻辑来源
- 主动买入成交量 = ∑(买方主动发起并成交的订单量)
- 识别方法:成交价格 ≥ 卖一价时,视为买方主动
- 主动卖出成交量 = ∑(卖方主动发起并成交的订单量)
- 识别方法:成交价格 ≤ 买一价时,视为卖方主动
- 买卖压力比 = 主动买入成交量 ÷ 主动卖出成交量
波动性指标的逻辑来源
- 实现波动率 = 价格对数收益率的标准差 × √交易时段数量
- 价格范围比率 = (最高价 - 最低价) ÷ 平均价格
- 微观波动率 = 高频价格变动的标准差 ÷ 平均价格
4. 高级衍生数据(复杂计算)
流动性指标的推演
- 有效价差 = 2 × |成交价格 - 中间价|
- 中间价 = (买一价 + 卖一价) ÷ 2
- 市场深度 = ∑(在中间价±X%范围内的买卖订单量)
- 市场影响成本 = (成交后价格 - 成交前价格) ÷ 成交前价格
- 恢复速度 = 1 ÷ (价格回归均衡所需时间)
交易者行为指标的推演
- 订单攻击性 = 市价单数量 ÷ 总订单数量
- 追涨指数 = 价格上涨时段的买入量 ÷ 正常时段买入量
- 杀跌指数 = 价格下跌时段的卖出量 ÷ 正常时段卖出量
- 交易持续性 = 连续交易时段数 ÷ 总交易时段数
市场质量指标的推演
- 价格发现效率 = 1 ÷ (新信息融入价格所需时间)
- 市场韧性 = 1 ÷ (大订单执行后价格恢复所需时间)
- 信息不对称指标 = 知情交易概率模型估计值
- 基于买卖价差和订单流不平衡计算
5. 推演案例:从原始订单到复杂指标
案例1:技术指标MACD的推演路径
- 原始数据:每笔成交价格和时间
- 一级聚合:计算每个时间段的收盘价
- 二级计算:计算不同周期的指数移动平均(EMA)
- 12周期EMA = 当日收盘价 × (2÷(12+1)) + 前一日EMA × (1-(2÷(12+1)))
- 26周期EMA = 当日收盘价 × (2÷(26+1)) + 前一日EMA × (1-(2÷(26+1)))
- 三级计算:MACD线 = 12周期EMA - 26周期EMA
- 四级计算:信号线 = MACD线的9周期EMA
- 最终指标:MACD柱状图 = MACD线 - 信号线
案例2:市场微观结构指标的推演路径
- 原始数据:订单提交、修改、取消和成交记录
- 一级处理:重建每一时刻的完整订单簿状态
- 二级计算:计算订单簿形状特征
- 订单簿倾斜度 = 买方订单量分布偏度 - 卖方订单量分布偏度
- 三级计算:订单流不平衡指标
- 订单流不平衡 = (买入订单量 - 卖出订单量) ÷ 总订单量
- 四级计算:价格压力指标
- 买方价格压力 = ∑(买单量i × 距离中间价百分比i)
- 卖方价格压力 = ∑(卖单量i × 距离中间价百分比i)
- 最终指标:净价格压力 = 买方价格压力 - 卖方价格压力
案例3:交易者情绪指标的推演路径
- 原始数据:每笔成交记录和订单信息
- 一级识别:区分主动买入和主动卖出成交
- 二级计算:计算买卖比率和攻击性指标
- 买卖比 = 主动买入量 ÷ 主动卖出量
- 攻击性指标 = 市价单占比
- 三级计算:与价格变动关联分析
- 情绪动量 = 买卖比变化率 × 价格变化率
- 四级计算:情绪波动性
- 情绪波动性 = 买卖比标准差 ÷ 买卖比均值
- 最终指标:市场情绪综合指数 = f(买卖比,攻击性,情绪动量,波动性)
6. 数据完整性与推演限制
数据缺失情况下的推演
- 成交量缺失:可通过高频报价变化频率间接估计
- 订单簿深度缺失:可通过可见档位外推估计完整订单簿
- 交易方向缺失:可通过价格与买卖价差的关系推断
推演限制
- 信息损失:聚合过程不可避免地损失微观信息
- 噪声干扰:原始数据中的噪声会在推演过程中放大
- 系统性偏差:市场结构变化可能导致推演关系失效
- 黑箱交易:暗池交易等不透明机制导致数据不完整
推演准确性提升
- 多源数据融合:结合交易所数据、券商数据和市场调查
- 统计校正:使用历史模式校正数据偏差
- 机器学习增强:使用AI技术填补数据缺口和识别模式
7. 交易数据的层次结构
从逻辑上看,交易数据形成了一个金字塔结构:
第5层: 预测性指标与决策支持
(交易机会评分、风险预警系统)
↑
第4层: 综合市场质量与行为指标
(市场效率、信息不对称、交易者情绪)
↑
第3层: 复杂衍生指标
(技术指标、波动性、流动性指标)
↑
第2层: 基本衍生数据
(价格变动、成交统计、订单簿特征)
↑
第1层: 原始交易数据
(成交记录、订单记录、订单簿快照)
↑
第0层: 交易行为
(订单提交、修改、取消、成交)
每一层数据都是对下一层的抽象和提炼,通过这种层次化结构,我们可以从最基础的交易行为推演出复杂的市场指标,最终支持交易决策。理解这种逻辑推演路径,有助于我们更准确地解读交易数据,识别数据间的内在联系,并开发更有效的交易策略。