写在前面:AI 能做什么,不能做什么
AI 预测是把“历史数据 + 有信息量的特征”映射到“未来一小段时间的走势/方向/波动”。对加密资产这类高波动、受宏观与叙事影响强的市场,AI 只能给出概率上的优势,不是“稳赚脚本”。请把它当作“辅助决策工具”,而不是信号即下单的“自动印钞机”。评估任何模型之前,先想清楚你要预测的是:价格水平、涨跌方向还是波动率(不同目标对应不同数据与算法)。
数据与特征:以太坊最有用的三大维度
1)纯价格与成交量序列:收盘价、对数收益、成交量、波动率等,是一切时间序列模型的基础。
2)情绪与关注度:Twitter 情绪、Google Trends 关注度等“注意力信号”,多项研究显示它们与加密资产收益或波动存在可用于预测的关系,尤其在短期窗口内更明显。
3)以太坊链上供需与费用:EIP-1559 将基础费(Base fee)永久销毁,而 PoS 下网络通过出块奖励发行新 ETH,供需动态共同影响净供给;基础费按前一区块的拥堵程度自动调整。将Gas、燃烧量、净发行等作为模型特征,能更贴近 ETH 的经济机制。
方法一:用 Prophet 做“可解释”的入门基线
Prophet 是一个易上手的加法模型,适合快速建立趋势 + 周期的基线预测,带不确定区间,Robust 对异常点。先用 Prophet 给出“趋势框架”,再叠加其它特征与模型对比,是新手最稳的起步姿势。
实操提示
- 目标变量用对数价格或对数收益,减少尺度与异方差影响。
- 对强叙事期(合并、升级前后)的结构性断点,可利用 Prophet 的“变化点”机制。
- Prophet 假设的季节性更适合有规律的时间序列,在纯加密价格上应视为基线,与更强的深度学习模型交叉验证后再决定是否采用。
方法二:LSTM/混合模型做非线性捕捉
LSTM 善于学习时间依赖与非线性,历年综述与最新工作均在加密预测上报告了良好表现;也有论文把 LSTM + XGBoost 组合起来提升短期拟合能力。对于 ETH,可把“价量特征 + 链上费燃烧/净发行 + 情绪因子”一起输入 LSTM,建模短期方向或波动。
实操提示
- 序列窗口(lookback)从 30–90 天试起;用归一化并在滚动验证中固定变换器。
- 防过拟合:早停、丢弃法(dropout)、权重衰减,控制参数规模;与 Prophet/简单回归作“基线对比”。
- 也可用 GRU、TCN 或 Transformer 替代做 ablation,择优上线。
情绪因子:Twitter 与 Google Trends 怎么接入
- Twitter:将主题相关推文做情绪判别(BERT/情感词典),形成“正负面得分/强度”,与收益或波动做滞后相关并入模。多项研究显示推文情绪对短期方向与波动具解释力。
- Google Trends:把“Ethereum/ETH”等关键词的检索热度处理为时序特征;文献显示其对收益或波动率的预测/改进有统计意义,但数据需去噪并防过拟合。
把“链上机制”变成可学的信号
- EIP-1559 燃烧:基础费被协议销毁,拥堵时上调、冷却时下调;当活动度高、燃烧增加时,净供给可能降低。把每日燃烧与净发行(发行–燃烧)序列作为特征。
- PoS 发行:验证者奖励导致新增 ETH,供给端与燃烧端共同决定动态供给。将活跃验证者、APR、总质押量等作为慢变量。
科学评估:别用“打乱划分”,请用滚动验证
时间序列不能随机打乱划分训练/测试。采用滚动起点交叉验证(walk-forward/rolling origin):训练窗口随时间前移,在每个切片上预测下一步/下一段,汇总多次误差更可靠。
常用指标与目标
- 方向准确率(Direction Accuracy)、MAE/RMSE;若做波动预测可用 MSE/QLIKE。
- 同时报告基线模型(如“保持不变/均值回归/Prophet”),只有在滚动验证中显著优于基线,模型才有价值。
一套可落地的最小闭环(无代码描述)
1)取数:价格/成交量(交易所或聚合数据),情绪(Twitter API/第三方)、Trends(Google Trends),链上(燃烧、Gas、净发行)。EIP-1559/PoS 结构请以以太坊官方文档为准。
2)特征工程:收益/波动、移动统计、情绪平滑(EMA)、燃烧与净发行的变化率,节假日/升级事件标记。
3)建模:以 Prophet/Y-回归作为可解释基线;并行训练 LSTM/GRU(方向或区间回归)。
4)验证:严格滚动验证 + 多期视窗(1D/3D/7D),与基线对比显著才进入部署。
5)上线与监控:漂移监控(特征分布、误差爆发),定期再训练;情绪与链上数据的“缺测/延迟”要有容错逻辑。
新手常见误区(以及你该怎么避开)
- 把情绪当“单一神谕”:推文/搜索热度在极端行情中可能反向;只能作为因子之一,且需去噪。
- 忽视机制变量:只喂价量不喂链上变量,错过 EIP-1559 燃烧/PoS 发行带来的供给侧信息。
- 错误切分:随机切分会“穿越时空”,高估模型;必须滚动验证。
- 只看回测收益:请先看方向/误差等可验证指标,再谈策略层收益;样本外失败要及时回滚到基线。
进阶阅读与扩展方向
- 更多深度模型:近期工作探索混合结构(LSTM + XGBoost)以提升短期预测;也有对不同架构(例如 TCN、Transformer)的比较。
- 多源融合:整合文本、视频等多模态情绪,研究显示在不同时间尺度上存在互补作用。
合规与风险声明
本文仅为教育信息,不构成投资建议。加密资产波动较大,历史结果不代表未来;请在小额与纸面账户中先验证模型稳定性与鲁棒性,再决定是否用于实盘。以太坊的机制(如 EIP-1559、PoS 发行)会随网络与提案演进而变化,特征含义与数据口径需以官方文档为准。