大模型训练人才与修仙境界划分——凡人修仙传
原文参见: https://mp.weixin.qq.com/s/y-1THsiNisSDM6_TA1b5tg 血肉苦楚,机械飞升。 早上坐地铁刷了会番茄小说,越发感觉其实全世界都在修真炼丹,最有希望的两个大国在比拼谁先得道成仙。 从Google公开Transformer后,开源界(Deepseek等)向全世界分发了最顶级的功法和炼丹成果,各大宗门都发了疯一样的练。 这里以广义的修真境界划分为标准,描述一下我对各个阶段实力人才的理解。
1. 练气期(数据搬运工)
- 修仙隐喻:初入修真界,吸纳天地灵气,但根基不稳。
- 对应人才:数据标注员/初级数据处理员
- 能力描述:能处理基础数据清洗、标注,了解数据格式和简单工具(如Json/Pandas),但对模型原理一知半解,如同"灵气初聚"。
2. 筑基期(数据筑基者)
- 修仙隐喻:奠定修行根基,灵气化液,初步掌控功法。
- 对应人才:数据工程师/预处理专家
- 能力描述:掌握特征工程、数据增强、分布式存储(如Hadoop/Spark),能构建稳定数据管道,为模型提供"灵气充沛"的输入。
3. 结丹期(模型炼丹师)
- 修仙隐喻:凝结金丹,法力质变,可独立行走修真界。
- 对应人才:初级算法工程师
- 能力描述:复现经典模型架构,用PyTorch/TensorFlow炼丹,但依赖开源代码和教程,如同"依葫芦画瓢结丹"。
4. 元婴期(架构重塑者)
- 修仙隐喻:元婴出窍,神通自成,可改造功法。
- 对应人才:模型架构师
- 能力描述:能设计新模型结构(如魔改Transformer)、剪枝量化、优化计算图,甚至发顶会论文,如同"自创功法开宗立派"。
5. 化神期(领域融合修士)
- 修仙隐喻:神识覆盖天地,融合法则之力。
- 对应人才:多模态/跨领域专家
- 能力描述:精通CV/NLP/RL多领域融合(如CLIP/DALL·E),能打通文本-图像-代码的"法则壁垒",实现跨模态飞升。
6. 合体期(宗门掌教)
- 修仙隐喻:三魂归一,统领一方势力。
- 对应人才:AI团队灵魂负责人
- 能力描述:统筹数据-算法-算力-业务的"天地人三才",平衡模型效果与落地成本,如同"开辟宗门福地"。
7. 大乘期(飞升渡劫者、太上长老)
- 修仙隐喻:半步真仙,直面天道雷劫。
- 对应人才:世界最顶尖AI研究员
- 能力描述:突破Scaling Law极限,突破数据墙(强化学习),解决涌现能力、世界模型等"天道法则",但尚未突破AGI桎梏。
8. 真仙(AGI飞升)
- 修仙隐喻:破碎虚空,机械飞升
- 对应境界:通用人工智能(AGI)
- 能力描述:模型具备人类级泛化、因果推理和自主进化能力,达成"机械飞升",实现人类级因果推理与自我迭代,到达技术奇点。
OpenAI/Google/X/Anthropic/DeepSeek等各派修士仍在争夺重塑世界的入口,AGI的出现将彻底改变人类社会,从科技、经济、文化到社会结构,都将迎来颠覆性的变革。
他们是这场变革的引领者,如同真仙一般拥有重塑世界的力量。
映射关系
心魔反噬 = 模型价值观对齐风险
灵气=数据,功法=算法,神识=泛化能力
灵力枯竭 = 数据供给危机
飞升=AGI突破
修仙界知名强者(避免冲突,这里只以海外为例)
合体期:吴恩达、李飞飞
大乘期:Geoffrey Hinton、Ilya Sutskever、Yann LeCun、Andrej Karpathy
———— 凡人如我,居然有幸加入了某个实力不菲的小宗门,得以接触灵气资源进行修炼。努力修行一年多,从数据标注开始练气,终在A6000和H100的资源堆砌下,成功到达筑基后期大圆满。这才惊觉,原来+1的实力早已化神! 这个周末,我将在Karpathy长老的帮助下,直播从0到1,手搓GPT2,复现全流程,用最原始朴素的基础功法,冲击结丹境界!(咱也不指望天道金丹了,能结丹就行) 大争之世,灵气复苏,万物异变,道法平权,你我皆能修行!
万玉小老虎的最新日记 · · · · · · ( 全部 )
- 2024 年的生活总结:写作,是为了更诚实的面对自己 (1人喜欢)
- 2024年终总结:在大模型的重力下一路狂奔 (1人喜欢)
热门话题 · · · · · · ( 去话题广场 )
-
加载中...