WorldQuant入门

Talent is distributed equally around the world, opportunity is not.

I have never let my schooling interfere with my education.

把量化工作(因子挖掘)变成一个分布式的工作

Chapter 1: Overview of Quant and key concepts

提交Alpha,获得2000积分(每日上限),5个自然日拿10000分接受审批,变成consultant。

consultant收入组成:

  1. base payment:1-120 USD/Day (质量分数)
  2. quarterly payment:上个季20天都有提交,100-25000 USD/季度
  3. competition
  4. referral 200 USD/success referral

genius program

新人激励(7个自然日 500元 14个自然日 1000元 20个自然日 1700元——不累计)

定级 (200 2000 8000):

数量 + 广度 + Performance

Gold - Expert - Master - Grandmaster

Alpha factory

data scientist (把世界上的信息收集到公司服务器; 尽可能精准地描述三维世界) -> Alpha research (量化研究员 找出能预测交易的信号;math model) ->portfolio manager(把信号组合起来变成策略)->traders (量化交易员执行manager的策略)

成为consultant之后,有十四万个数据字段可用,双赢——自己研究不完;其他平台没有这么多可用数据

密码学公钥和私钥的关系,缺一不可,互帮互助

Develop quant idea with brain

  1. collect data and info
  2. 点子和假设
  3. translate idea into math model
  4. backtest(回测) idea on historical data
  5. check for robustness

BRAIN本身就是一个很好的回测平台

Key concepts

momentum(动量) vs reversal(回归均值)

momentum eg. 资产负债率越高,涨得越好- 顺势为 涨时买入 跌时做空

reversal eg. 假设你转 - 逆势为 越跌越买 越高越卖

cross-sectional vs time-series (两种数据处理方式)

第一种是横着比出来的 eg 资产负债率高,横向比出来的

第二种是纵着比出来的 eg 资产状况改善,纵向比出来的

First Alpha

liabilities/assets - 应该是资产负债率

Q & A

提交20个以上Alpha成为consultant的优先度会提升

录制时间是3.18之前

competition分为针对用户(IQC,user才能参加)和针对consultant的比赛

数据字段就是一个excel表 eg assets(原始的公司的总资产,把)

横轴就是时间 纵轴就是不同的股票 - 阅读brain平台的数据基础,macd这种指标都有算好的

garbage in garbage out - 量化交易员不要过早用机器学习,把其当作灵丹妙药,要切实做好每一个alpha

数据已经清理好了,平台给个人赋能

学习资源 - learn,community(跟alpha相关的灵感的帖子都复现一遍 - 这个可以做一两个月了)

问问题顺序:群 -> community -> 邮件


!课后作业晚点补一下


Chapter 2: Write your first Alpha by our fast expression language

What is Alpha

跟金融的alpha不一样——对WQ来说,Alpha就是一个数学模型,一个数学公式。

这个数学模型根据neutralization setting和normalization,每天算出来一个weight。

Alpha本质上就是operator和data的组合。

Data & Operator

data是食材,operator是厨具。有时候优秀的食材只需要简单的烹饪方式。

alpha写得很长说明做饭程序很多,是个大菜,但不一定好吃。

今天介绍不完,只能捡重点讲。operator在learn;data在data

Understand your data (定性地去了解)

两种data:

  1. fundamental data(基本面数据) - 出自balance sheet资产负债表、income statement收入表、cash flow statement现金流表;
  2. price-volume datasets (量价数据) - open,close,high,low,vwap(volume-weighted average price),adv20(average daily volume 20 - 过去20天成交量,time series operator就可以算)
ts_mean(xx, 20)

基本面数据跟新的更新频率(frequency):财报是一个季度更新一次

datasets & data fields

data fields在datasets中。基本面数据就是个datasets;simulation中只读data fields

eg fnd_6 = fundamental6 (simulation不认)

定性地去了解

定量地去了解

six tips - 通过数据特征去逆向了解 (帖子:6 ways to evaluate a dataset)

  1. neutralization - none
  2. decay - 0

coverage - longcount(有几只股票)

longcount-做多;shortcount-做空

operator

  1. Time-Series: Ts_delta(x, n): x[date] - x[date-n]
  2. Cross-sectional:
  3. Multi-Source:

Rank(x) - 把数据集变成ordinal

sign(x) -

scale(x) -

eg. 量价齐升

Advanced operator

trade_when(entry_condition, alpha, exit_condition)

From 1 Alpha to Million Alphas

Alpha - Alpha Template - Alpha Space - Alternative Alphas

eg. group_rank(fnd6_)


Q&A

Alpha精进到最好再提交

不用挂到电脑上等,一个consultant一般是用一个云服务器去挂,一周simulation的数量是7-8万次左右。consultant能一次跑100个,而不是跟user一样一个一个跑。一个优秀的研究员在这个过程中就直接去找下一个idea,下一个模板了

做量化需要有很强的抗挫折能力,慢慢调,idea不work可能是由噪音,把alpha写得更复杂一点

learn - courses - doc(仔细过一遍)

看原始数据对量化研究的影响不大。worldquant的十四万个字段发派全球,本身就是因为自己人看不完,闲置资源浪费了,所以搞分布式,拿到的钱肯定是比full-time的少的。


作业

Day2参考文章《101个Alpha》
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2701346

该⽂章为本书课《使⽤快速读⽂式写出策略》的⽣成提供了很好的样本和思路,展示了如何将⽂字语⾔转化成数学语言的多种范例。供参考!

Day2参考⽂章之论坛资源
https://support.worldquantbrain.com/hc/en-us/community/posts/13954113156503-Research-paper-1-The-Momentum-of-News


Day2课后作业(所有必做):

  • 必做:参考6tips⽂章,研究出datafield anl4_cff_flag 的更新频率,并解释理由https://support.worldquantbrain.com/hc/en-us/community/posts/11807866133911--BRAIN-TIPS-6-ways-to-quickly-evaluate-a-new-dataset

    • 提示:最好附上回测截图进⾏说明。
  • 必做:解释 trade_when operator的逻辑,并使⽤ if_else operator的嵌套等价实现trade_when operator
    - 注: ts_delta(data,1) 可以使⽤ data - ts_delay(data,1) 等价实现。思考并回答

    • trade_when(alpha>1,alpha,alpha-1) 可以等价于什么?
  • 必做:使⽤get datafields批量生成alpha,并对所有alpha进⾏回测。要求在下节课前实现20次以上回测(截图+alpha id)。

    • 特别注意:不要忘提交,因为challenge score每天仅更新⼀次。

Chapter 3:

作业讲解

trade when - 建仓 平仓

Neutralization

多空平衡策略——一半钱做多,一半钱做空;把一个dataset分成group则算组内均值

精细的分组对alpha的精确表达影响很大 - 它直接影响normalized weight,决定多空

Alpha improvement: Group Operators

  • operator
  • group data field: Market - sector - industry - subindustry

New groupings - group data field (分层分类法)

  1. stats grouping - 例如把波动率像的放在一起
  2. bucket operator - custom grouping according to quantiles
densify() - 把组压缩成更少的编号,节省算力

Good Alpha

Solid alpha - solid idea (research paper; articles about fin trading) - unique implementation (understand data and operators) - enhancement techniques

不要挖矿,idea就是本体论,要想哲学家一样去理解世界上什么是真的

From 1 Alpha to a million alphas - advance

Alpha

group_rank(ts_rank(eps, 252), industry)

Alpha template

group_rank(ts_rank(fundamental, 252), industry)

进一步拓展自由度

<group_compare_op>(<ts_compare_op>(<company_fundamentals>, <days>), <group>)

Chapter 4: Improve the robustness of your Alpha

作业讲解

把上次作业的task 1全看一遍 - Alpha灵感启示录

大部分人都是分母,成为consultant之后就不做了,活跃的consultant可能就是7000个,前2%就是140人。

Decay and Vector

decay

线性加权平均 - decay_linear() - 有对应的公式套数值就行

理解setting中的参数和代码中的表达的对应关系,不能词不达意

vector data

matrix data - 二维数据

eg. close: 横轴是时间,纵轴是不同股票

vector data就是三维数据(一个公司一天有好几个条目 - 需要转化成matrix data;三维变二维)

Quality & Quantity

underfit - just-right-fit - overfit

如何判断overfitting还是underfitting

考虑样本外如何赚钱

What is good alpha

Robustness

robust under different scenarios (include different universe, region, parameter, decay, etc.)

最好是样本外 = 样本内 (IS Sharp = OS Sharp)

Uniqueness

Value-add

Consistency

Good practice

open-minded :不要前无古人后无来者,多参考

Don’ts

  1. Tune for specific words
  2. fitting correlation
  3. fitting drawdown
  4. use too many parameters/factors/nodes
  5. spend too much time on a single idea - 花时间去写,而不是改

用模板的思维构建alpha

参考前两课的从一到多

对于失败案例

把数据留存下来,回测没结果也是重要的信号,失败案例可以用作机器学习的归纳的工作

成熟研究员工作流

两个nb - worker (read and send; retrieve and write),两个csv(pending dataset, complete dataset)

worker:

  1. send 10 alpha simultaneously
  2. for loop check if they complete -> complete database
  3. alpha done -> new alpha

Q&A

最重要的动作

  1. 好奇,碰到金融学词汇就去查找相关的含义;
  2. 接受模糊的正确(一知半解),不必要非要看到meta data才安心;
  3. 在战斗中学习,直接拿论文/研报/帖子去复原,比如做量价的帖子,没有什么书来系统性地学习

为什么不单独做

离开Brain之后找alpha的难度成倍增加——数据以及其整理和处理方式是WorldQuant的资产。世界很多时候都是这样的,是互利共赢,1+1大于2,一个人单打独斗很难搞出来世界级的东西。

晋升

越成熟越轻松——前期很难,全球前几名都是有非常忙的工作,一周只花一点时间写一写alpha,然后收割提交。晋升倒是没有什么,就是做兼职很快乐,找alpha,适应更多的region、industry等等,然后拿钱很快乐。

Alpha未必要cover越多情况越好

某些特定行业的alpha全时间段都适用的也很好(比如针对科技行业的alpha),但不能牛市能预测,但熊市不行,这相当于还是没有清楚市场的脾气,没有很好地去拟合。

WorldQuant信息

  1. 接受中国区发出的research consultant的offer之后,会不会比美国的offer薪资更低,worldquant的薪资有做地区差异吗?
  • 这个一个兼职,薪资跟你的成长是挂钩的,没有地区差异,新手期3个月收入较低,如果在新手期alpha交的不错,在度过新手期后收入是成指数线增长的
  1. Samuel提到他之前就分享过这个副业,但我扒了他之前的视频,并没有找到跟WorldQuant相关的,我想问下Samuel那边是不是还存在b站之外的社群?
  • 之前分享的视频他删了
  1. WorldQuant在今年的四月到现在consultant数量是翻倍扩张的,但公司是07年就成立了,为什么?
  • 在进入的中国不叫wq,叫其他名字中间还停过几年,在19还是20改的这个名字,然后一直不温不火,去年10月份和今天3月份游牧人发了两期视频起来的。
  1. Samuel视频里说他是wq的合作者只是转发推广链接的其中之一吗?
  • 他是转发推荐链接之一,其他还有,比如查理冬明。他的转化率高,做的比samuel时间长。
  1. 加入WQU后5年不能做wq这个兼职,那么先做兼职然后再上WQU,这个兼职状态会终止吗?
  • 这个需要问WQU。
  1. 后续的培训分地区吗?跟推荐人referral的所在地相关吗?
  • 分地区,薪资一样,税不一样;跟referral的所在地不相关。

我仔细看了wq的region:

At present, we are offering this Research consultant opportunity exclusively to residents of:

  • Armenia
  • Mainland China
  • Hong Kong
  • Taiwan
  • Hungary
  • Kenya
  • Korea
  • Indonesia
  • India
  • Malaysia
  • Singapore
  • UK
  • Vietnam
  • Thailand
  • USA

这他么纯粹南北对话了。发达国家看不上的兼职,能变成发展中国家小资的全职。

答疑课

New Rule of QN

  1. 填个人信息问卷 — GOLD
  2. 初审通过 — 1–2 Week
  3. 复审通知 + 问卷(需严肃对待)
    • 等待时间
    • 总提交
    • 总回测
    • 提交天数
    • 行为分数
    • 持续活跃
    • 问卷

Con.

问题题型
User ID单行文本
注册邮箱单行文本(邮箱)
了解:该测试的回答结果对我是否进入复审队列有重大影响单选
您是否有已发布或审核中的 Alpha idea 相关的帖子?请粘贴链接至此处,否则填无文本/链接
谈一谈您对 Fitness 公式的理解,以及其如何影响到您的研究方法和提交策略长文本(开放题)
除《零基础学量化》和其它官方提供的代码框架外,您有哪些额外代码和工程改进。这个改进如何提高了你在 BRAIN 平台的研究效率和质量?请举例具体说明长文本(开放题)
在你的研究过程中,如何判断一个 alpha 是否值得提交?都有那些考虑因素?长文本(开放题)
请简要描述您 BRAIN alpha 构建的整体流程长文本(开放题)
请描述您在研究中如何选取和需要使用的 BRAIN 数据集?长文本(开放题)
您对 BRAIN 平台有哪些功能的建议,以便我们改进后可以更好帮助你的研究工作长文本(开放题)

活动 + 速通

优秀案例

错误行为

  • AI水文(警告甚至禁言)
  • 逆向工程(基于常见已有 alpha 模板产出的可提交 alpha 进行解释)
  • 已有文章的简单变种

Note

  • 不是所有通过的都会在中文论坛
  • 通过的会有马克杯礼物
  • 优秀的将统一被邀请分享,有 one-time-stipend 奖励 150

ideal consultant

  • 代码能力 - 大规模回测(2万个 1800x10天 - 提交50个alpha)
  • alpha research(research的快感和成就感-能否收获跟debug一样的快感)
Last modified on 2025-08-20 • Suggest an edit of this page
← Prev: 不要愈合!不准愈合!
Next: ASUS ROG 显示器的GameVisual八大模式详解 →