Talent is distributed equally around the world, opportunity is not.
I have never let my schooling interfere with my education.
把量化工作(因子挖掘)变成一个分布式的工作
Chapter 1: Overview of Quant and key concepts
提交Alpha,获得2000积分(每日上限),5个自然日拿10000分接受审批,变成consultant。
consultant收入组成:
- base payment:1-120 USD/Day (质量分数)
- quarterly payment:上个季20天都有提交,100-25000 USD/季度
- competition
- referral 200 USD/success referral
genius program
新人激励(7个自然日 500元 14个自然日 1000元 20个自然日 1700元——不累计)
定级 (200 2000 8000):
数量 + 广度 + Performance
Gold - Expert - Master - Grandmaster
Alpha factory
data scientist (把世界上的信息收集到公司服务器; 尽可能精准地描述三维世界) -> Alpha research (量化研究员 找出能预测交易的信号;math model) ->portfolio manager(把信号组合起来变成策略)->traders (量化交易员执行manager的策略)
成为consultant之后,有十四万个数据字段可用,双赢——自己研究不完;其他平台没有这么多可用数据
密码学公钥和私钥的关系,缺一不可,互帮互助
Develop quant idea with brain
- collect data and info
- 点子和假设
- translate idea into math model
- backtest(回测) idea on historical data
- check for robustness
BRAIN本身就是一个很好的回测平台
Key concepts
momentum(动量) vs reversal(回归均值)
momentum eg. 资产负债率越高,涨得越好- 顺势为 涨时买入 跌时做空
reversal eg. 假设你转 - 逆势为 越跌越买 越高越卖
cross-sectional vs time-series (两种数据处理方式)
第一种是横着比出来的 eg 资产负债率高,横向比出来的
第二种是纵着比出来的 eg 资产状况改善,纵向比出来的
First Alpha
liabilities/assets - 应该是资产负债率
Q & A
提交20个以上Alpha成为consultant的优先度会提升
录制时间是3.18之前
competition分为针对用户(IQC,user才能参加)和针对consultant的比赛
数据字段就是一个excel表 eg assets(原始的公司的总资产,把)
横轴就是时间 纵轴就是不同的股票 - 阅读brain平台的数据基础,macd这种指标都有算好的

garbage in garbage out - 量化交易员不要过早用机器学习,把其当作灵丹妙药,要切实做好每一个alpha
数据已经清理好了,平台给个人赋能
学习资源 - learn,community(跟alpha相关的灵感的帖子都复现一遍 - 这个可以做一两个月了)
问问题顺序:群 -> community -> 邮件
!课后作业晚点补一下
Chapter 2: Write your first Alpha by our fast expression language
What is Alpha
跟金融的alpha不一样——对WQ来说,Alpha就是一个数学模型,一个数学公式。
这个数学模型根据neutralization setting和normalization,每天算出来一个weight。
Alpha本质上就是operator和data的组合。
Data & Operator
data是食材,operator是厨具。有时候优秀的食材只需要简单的烹饪方式。
alpha写得很长说明做饭程序很多,是个大菜,但不一定好吃。
今天介绍不完,只能捡重点讲。operator在learn;data在data
Understand your data (定性地去了解)
两种data:
- fundamental data(基本面数据) - 出自balance sheet资产负债表、income statement收入表、cash flow statement现金流表;
- price-volume datasets (量价数据) - open,close,high,low,vwap(volume-weighted average price),adv20(average daily volume 20 - 过去20天成交量,time series operator就可以算)
ts_mean(xx, 20)
基本面数据跟新的更新频率(frequency):财报是一个季度更新一次
datasets & data fields
data fields在datasets中。基本面数据就是个datasets;simulation中只读data fields
eg fnd_6 = fundamental6 (simulation不认)
定性地去了解
定量地去了解
six tips - 通过数据特征去逆向了解 (帖子:6 ways to evaluate a dataset)
- neutralization - none
- decay - 0
coverage - longcount(有几只股票)
longcount-做多;shortcount-做空
operator
- Time-Series: Ts_delta(x, n): x[date] - x[date-n]
- Cross-sectional:
- Multi-Source:
Rank(x) - 把数据集变成ordinal
sign(x) -
scale(x) -
eg. 量价齐升
Advanced operator
trade_when(entry_condition, alpha, exit_condition)
From 1 Alpha to Million Alphas
Alpha - Alpha Template - Alpha Space - Alternative Alphas
eg. group_rank(fnd6_)
Q&A
Alpha精进到最好再提交
不用挂到电脑上等,一个consultant一般是用一个云服务器去挂,一周simulation的数量是7-8万次左右。consultant能一次跑100个,而不是跟user一样一个一个跑。一个优秀的研究员在这个过程中就直接去找下一个idea,下一个模板了
做量化需要有很强的抗挫折能力,慢慢调,idea不work可能是由噪音,把alpha写得更复杂一点
learn - courses - doc(仔细过一遍)
看原始数据对量化研究的影响不大。worldquant的十四万个字段发派全球,本身就是因为自己人看不完,闲置资源浪费了,所以搞分布式,拿到的钱肯定是比full-time的少的。
作业
Day2参考文章《101个Alpha》
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2701346
该⽂章为本书课《使⽤快速读⽂式写出策略》的⽣成提供了很好的样本和思路,展示了如何将⽂字语⾔转化成数学语言的多种范例。供参考!
Day2参考⽂章之论坛资源
https://support.worldquantbrain.com/hc/en-us/community/posts/13954113156503-Research-paper-1-The-Momentum-of-News
Day2课后作业(所有必做):
必做:参考6tips⽂章,研究出datafield anl4_cff_flag 的更新频率,并解释理由https://support.worldquantbrain.com/hc/en-us/community/posts/11807866133911--BRAIN-TIPS-6-ways-to-quickly-evaluate-a-new-dataset。
- 提示:最好附上回测截图进⾏说明。
必做:解释 trade_when operator的逻辑,并使⽤ if_else operator的嵌套等价实现trade_when operator。
- 注:ts_delta(data,1)可以使⽤data - ts_delay(data,1)等价实现。思考并回答trade_when(alpha>1,alpha,alpha-1)可以等价于什么?
必做:使⽤get datafields批量生成alpha,并对所有alpha进⾏回测。要求在下节课前实现20次以上回测(截图+alpha id)。
- 特别注意:不要忘提交,因为challenge score每天仅更新⼀次。
Chapter 3:
作业讲解
trade when - 建仓 平仓
Neutralization
多空平衡策略——一半钱做多,一半钱做空;把一个dataset分成group则算组内均值
精细的分组对alpha的精确表达影响很大 - 它直接影响normalized weight,决定多空
Alpha improvement: Group Operators
- operator
- group data field: Market - sector - industry - subindustry
New groupings - group data field (分层分类法)
- stats grouping - 例如把波动率像的放在一起
- bucket operator - custom grouping according to quantiles
densify() - 把组压缩成更少的编号,节省算力
Good Alpha
Solid alpha - solid idea (research paper; articles about fin trading) - unique implementation (understand data and operators) - enhancement techniques
不要挖矿,idea就是本体论,要想哲学家一样去理解世界上什么是真的
From 1 Alpha to a million alphas - advance
Alpha
group_rank(ts_rank(eps, 252), industry)
Alpha template
group_rank(ts_rank(fundamental, 252), industry)
进一步拓展自由度
<group_compare_op>(<ts_compare_op>(<company_fundamentals>, <days>), <group>)
Chapter 4: Improve the robustness of your Alpha
作业讲解
把上次作业的task 1全看一遍 - Alpha灵感启示录
大部分人都是分母,成为consultant之后就不做了,活跃的consultant可能就是7000个,前2%就是140人。
Decay and Vector
decay
线性加权平均 - decay_linear() - 有对应的公式套数值就行
理解setting中的参数和代码中的表达的对应关系,不能词不达意
vector data
matrix data - 二维数据
eg. close: 横轴是时间,纵轴是不同股票
vector data就是三维数据(一个公司一天有好几个条目 - 需要转化成matrix data;三维变二维)
Quality & Quantity
underfit - just-right-fit - overfit
如何判断overfitting还是underfitting
考虑样本外如何赚钱
What is good alpha
Robustness
robust under different scenarios (include different universe, region, parameter, decay, etc.)
最好是样本外 = 样本内 (IS Sharp = OS Sharp)
Uniqueness
Value-add
Consistency
Good practice
open-minded :不要前无古人后无来者,多参考
Don’ts
- Tune for specific words
- fitting correlation
- fitting drawdown
- use too many parameters/factors/nodes
- spend too much time on a single idea - 花时间去写,而不是改
用模板的思维构建alpha
参考前两课的从一到多
对于失败案例
把数据留存下来,回测没结果也是重要的信号,失败案例可以用作机器学习的归纳的工作
成熟研究员工作流
两个nb - worker (read and send; retrieve and write),两个csv(pending dataset, complete dataset)
worker:
- send 10 alpha simultaneously
- for loop check if they complete -> complete database
- alpha done -> new alpha
Q&A
最重要的动作
- 好奇,碰到金融学词汇就去查找相关的含义;
- 接受模糊的正确(一知半解),不必要非要看到meta data才安心;
- 在战斗中学习,直接拿论文/研报/帖子去复原,比如做量价的帖子,没有什么书来系统性地学习
为什么不单独做
离开Brain之后找alpha的难度成倍增加——数据以及其整理和处理方式是WorldQuant的资产。世界很多时候都是这样的,是互利共赢,1+1大于2,一个人单打独斗很难搞出来世界级的东西。
晋升
越成熟越轻松——前期很难,全球前几名都是有非常忙的工作,一周只花一点时间写一写alpha,然后收割提交。晋升倒是没有什么,就是做兼职很快乐,找alpha,适应更多的region、industry等等,然后拿钱很快乐。
Alpha未必要cover越多情况越好
某些特定行业的alpha全时间段都适用的也很好(比如针对科技行业的alpha),但不能牛市能预测,但熊市不行,这相当于还是没有清楚市场的脾气,没有很好地去拟合。
WorldQuant信息
- 接受中国区发出的research consultant的offer之后,会不会比美国的offer薪资更低,worldquant的薪资有做地区差异吗?
- 这个一个兼职,薪资跟你的成长是挂钩的,没有地区差异,新手期3个月收入较低,如果在新手期alpha交的不错,在度过新手期后收入是成指数线增长的
- Samuel提到他之前就分享过这个副业,但我扒了他之前的视频,并没有找到跟WorldQuant相关的,我想问下Samuel那边是不是还存在b站之外的社群?
- 之前分享的视频他删了
- WorldQuant在今年的四月到现在consultant数量是翻倍扩张的,但公司是07年就成立了,为什么?
- 在进入的中国不叫wq,叫其他名字中间还停过几年,在19还是20改的这个名字,然后一直不温不火,去年10月份和今天3月份游牧人发了两期视频起来的。
- Samuel视频里说他是wq的合作者只是转发推广链接的其中之一吗?
- 他是转发推荐链接之一,其他还有,比如查理冬明。他的转化率高,做的比samuel时间长。
- 加入WQU后5年不能做wq这个兼职,那么先做兼职然后再上WQU,这个兼职状态会终止吗?
- 这个需要问WQU。
- 后续的培训分地区吗?跟推荐人referral的所在地相关吗?
- 分地区,薪资一样,税不一样;跟referral的所在地不相关。
我仔细看了wq的region:
At present, we are offering this Research consultant opportunity exclusively to residents of:
- Armenia
- Mainland China
- Hong Kong
- Taiwan
- Hungary
- Kenya
- Korea
- Indonesia
- India
- Malaysia
- Singapore
- UK
- Vietnam
- Thailand
- USA
这他么纯粹南北对话了。发达国家看不上的兼职,能变成发展中国家小资的全职。
答疑课
New Rule of QN
- 填个人信息问卷 — GOLD
- 初审通过 — 1–2 Week
- 复审通知 + 问卷(需严肃对待)
- 等待时间
- 总提交
- 总回测
- 提交天数
- 行为分数
- 持续活跃
- 问卷
Con.
| 问题 | 题型 |
|---|---|
| User ID | 单行文本 |
| 注册邮箱 | 单行文本(邮箱) |
| 了解:该测试的回答结果对我是否进入复审队列有重大影响 | 单选 |
| 您是否有已发布或审核中的 Alpha idea 相关的帖子?请粘贴链接至此处,否则填无 | 文本/链接 |
| 谈一谈您对 Fitness 公式的理解,以及其如何影响到您的研究方法和提交策略 | 长文本(开放题) |
| 除《零基础学量化》和其它官方提供的代码框架外,您有哪些额外代码和工程改进。这个改进如何提高了你在 BRAIN 平台的研究效率和质量?请举例具体说明 | 长文本(开放题) |
| 在你的研究过程中,如何判断一个 alpha 是否值得提交?都有那些考虑因素? | 长文本(开放题) |
| 请简要描述您 BRAIN alpha 构建的整体流程 | 长文本(开放题) |
| 请描述您在研究中如何选取和需要使用的 BRAIN 数据集? | 长文本(开放题) |
| 您对 BRAIN 平台有哪些功能的建议,以便我们改进后可以更好帮助你的研究工作 | 长文本(开放题) |
活动 + 速通
优秀案例
错误行为
- AI水文(警告甚至禁言)
- 逆向工程(基于常见已有 alpha 模板产出的可提交 alpha 进行解释)
- 已有文章的简单变种
Note
- 不是所有通过的都会在中文论坛
- 通过的会有马克杯礼物
- 优秀的将统一被邀请分享,有 one-time-stipend 奖励 150
ideal consultant
- 代码能力 - 大规模回测(2万个 1800x10天 - 提交50个alpha)
- alpha research(research的快感和成就感-能否收获跟debug一样的快感)