数据分析师 L1:入门筑基
数据分析师入门指南,帮助0-1年经验的新人掌握SQL、Python、Excel等核心技能,建立数据思维,从零开始进入数据分析领域。
数据分析师 L1:入门筑基#
[!quote] 写在前面 如果你正在读这篇文档,说明你对数据分析产生了兴趣,或者已经决定往这个方向发展。不管你现在是什么背景——在校学生、刚毕业的应届生、想转行的职场人,还是想给自己加一项技能的业务人员——我都想先告诉你一件事:你选择了一个正确的方向。
数据分析不是什么高不可攀的技术,它本质上是一种用事实说话的思维方式。这篇文档会尽可能真诚地告诉你,在入门阶段你需要学什么、会遇到什么困难、以及如何避开我们踩过的坑。
这个阶段的你,可能是这样的#
在开始学习之前,我想先描述几个典型的 L1 学习者画像。看看有没有和你相似的:
画像一:在校学生,想找份数据相关的工作#
你可能是大三大四的学生,专业可能是统计、经济、计算机,也可能完全不相关。你听说数据分析师是个不错的岗位,薪资还可以,门槛也不像程序员那么高。但你打开招聘网站,发现要求写着”熟练使用 SQL”、“精通 Python”、“有数据分析经验”,你有点慌——这些你都不太会。
给你的建议:不要被招聘要求吓到。那些”精通”往往是 HR 的模板用语。L1 阶段你需要做的就是:能用 SQL 从数据库里把数据取出来,能用 Excel 或 Python 做基本的数据处理和图表。这两件事,认真学 2-3 个月完全可以做到。
画像二:刚入职的新人,工作中需要用到数据#
你可能刚入职一家公司,岗位是运营、产品、市场,甚至是销售。老板经常让你”拉个数据”、“做个分析”,你发现 Excel 透视表已经不够用了,同事们都在用一个叫 SQL 的东西从”数据库”里取数。你想学,但不知道从哪开始。
给你的建议:你的优势是有真实的业务场景。很多人学数据分析最大的困难是”不知道分析什么”,而你天天都有真实问题要解决。建议你从 SQL 开始学起,因为这是最快能在工作中用上的技能。学的时候直接用公司的数据练习(注意权限),进步会非常快。
画像三:想转行,但对自己的能力没信心#
你可能已经工作了几年,做的是和数据完全不相关的工作。你想转行,看了很多帖子,有人说”零基础三个月转行成功”,也有人说”没有统计学背景很难”。你不知道该信谁,也不确定自己能不能学会。
给你的建议:转行确实需要付出更多努力,但绝对不是不可能。数据分析的入门门槛没有你想象的那么高。我见过文科背景、完全零基础的人,通过半年的系统学习成功转行。关键是:不要只看教程,要动手做项目。哪怕是用公开数据集做一个分析,也比看十个视频有用。
L1 阶段的核心目标#
用一句话概括 L1 阶段的目标:
能够独立完成”发生了什么”这个层面的分析。
具体来说,就是:
- 业务方问你”上周的销售额是多少”,你能从数据库里查出来
- 老板说”做个用户画像”,你能用数据描述出用户的基本特征
- 产品问”这个功能上线后数据怎么样”,你能拉出数据做个前后对比
注意,L1 阶段不要求你解释”为什么会这样”(那是 L2 的事),也不要求你预测”接下来会怎样”(那是 L3 的事)。你的任务就是:准确地描述事实。
必须掌握的核心技能#
1. SQL —— 最重要的技能,没有之一#
我把 SQL 放在第一位,因为它真的是数据分析师吃饭的家伙。不管你在什么公司、什么行业,只要做数据分析,就一定要用 SQL 从数据库里取数。
需要掌握到什么程度?
L1 阶段,你需要能够:
- 写
SELECT ... FROM ... WHERE基础查询 - 用
GROUP BY做分组统计 - 用
JOIN连接多张表 - 用
ORDER BY排序,用LIMIT限制结果数量
就这些。不需要写存储过程,不需要懂数据库优化,不需要会窗口函数(那是 L2 的内容)。
推荐的学习路径:
- 先学基础语法:SQL基本概念 ↗ → SELECT语句结构 ↗ → WHERE条件筛选 ↗
- 学会聚合统计:聚合函数详解 ↗ → [GROUP BY分组](https://pro.ss-data.cc/knowledge/12-GROUP ↗ BY分组)
- 学会多表查询:JOIN连接 ↗ —— 这是 L1 阶段最难的部分,但也是最重要的
[!warning] 新手最常犯的错误 不要在生产数据库直接运行
SELECT *,尤其是对大表。我见过新人这样拉数,直接把数据库搞崩了,整个公司的系统都受影响。养成习惯:先SELECT COUNT(*)看看有多少条数据,再决定怎么取。
怎么练习?
最好的方式是用真实数据。如果公司有数据权限,就用公司的数据练(当然要遵守数据安全规定)。如果没有,可以用公开数据集,比如 Kaggle 上的数据,导入到本地 MySQL 里练习。
2. Excel / Google Sheets —— 不要小看它#
很多人觉得 Excel 太 low,学数据分析就应该直接学 Python。这是个误区。
Excel 的优势是快。老板让你 5 分钟内给个数据,你打开 Excel 透视表几下就搞定了;如果你非要用 Python,等你把环境配好、代码写完,老板早就等不及了。
L1 阶段需要掌握的 Excel 技能:
- 透视表(Pivot Table):这是 Excel 最强大的功能,必须熟练
- VLOOKUP / XLOOKUP:用于多表关联
- 基础图表:柱状图、折线图、饼图
- 条件格式:快速发现数据中的异常
什么时候用 Excel,什么时候用 Python?
一个简单的判断标准:
- 数据量在 10 万行以内,用 Excel 通常更快
- 数据量超过 10 万行,或者需要重复处理,用 Python
- 需要快速给非技术人员展示,用 Excel
- 需要做复杂的数据清洗或建模,用 Python
3. Python + Pandas —— 入门即可#
L1 阶段对 Python 的要求不高。你不需要成为 Python 程序员,只需要会用 Pandas 这个库做基本的数据处理。
需要掌握的内容:
- Python 基础语法:变量、循环、函数(不需要太深)
- Pandas 的基本操作:读取数据、筛选、分组、合并
- 基础可视化:用 Matplotlib 或 Seaborn 画图
推荐学习路径:
Python学习路线图 ↗ → 环境搭建 ↗ → 基础语法 ↗ → Pandas数据结构 ↗ → Pandas数据操作 ↗
[!tip] 学 Python 的正确姿势 不要花太多时间在语法细节上。很多人学 Python 花了一个月还在纠结”列表和元组有什么区别”,这就跑偏了。数据分析用的 Python 语法非常有限,你只需要会用 Pandas 处理数据就行。遇到不会的语法,随用随查。
4. 数据思维 —— 容易被忽视但很重要#
技术可以速成,但思维需要慢慢培养。什么是数据思维?简单说就是:
- 用数据说话,而不是用感觉:不说”我觉得用户喜欢这个功能”,而说”数据显示这个功能的使用率是 35%”
- 会问正确的问题:老板说”分析一下用户”,你要能追问”您想了解用户的哪个方面?是活跃度、付费还是留存?”
- 对数字敏感:看到”转化率提升了 50%“,你会想”基数是多少?是从 2% 提升到 3%,还是从 20% 提升到 30%?”
5. AI 工具 —— 你的新学习伙伴#
2024 年之后入行的数据分析师,有一个前辈们没有的优势:AI 助手。
ChatGPT、Claude、GitHub Copilot 这些工具,正在改变数据分析的学习和工作方式。L1 阶段,你应该学会把 AI 当作学习伙伴:
AI 可以帮你做什么?
- 解释代码和概念:
你:这段 SQL 是什么意思?
SELECT user_id, COUNT(*) FROM orders GROUP BY user_id HAVING COUNT(*) > 5
AI:这段 SQL 的意思是:从 orders 表中,按 user_id 分组,
统计每个用户的订单数量,只保留订单数大于 5 的用户。plaintext- 帮你写 SQL:
你:帮我写一个 SQL,统计每个月的新增用户数
AI:SELECT DATE_FORMAT(register_time, '%Y-%m') as month,
COUNT(DISTINCT user_id) as new_users
FROM users
GROUP BY DATE_FORMAT(register_time, '%Y-%m')
ORDER BY month;plaintext- Debug 和优化:当你的 SQL 报错或跑得很慢,可以把代码贴给 AI,让它帮你找问题。
但 AI 不能替代你做什么?
- 理解业务:AI 不知道你们公司的”活跃用户”是怎么定义的
- 判断结果是否合理:AI 给你的 SQL 可能语法正确但逻辑错误
- 提出正确的问题:AI 只能回答问题,不能帮你想出该问什么问题
- 沟通和汇报:最终还是要你来给老板讲清楚数据说明了什么
[!warning] AI 时代的学习建议 不要因为有 AI 就跳过基础学习。如果你完全不懂 SQL,AI 给你的代码你也看不懂、改不了、不知道对不对。正确的姿势是:先学基础,再用 AI 提效。把 AI 当作”随时可以请教的师兄”,而不是”替你做作业的外挂”。
推荐的 AI 使用方式:
| 场景 | 推荐做法 | 不推荐做法 |
|---|---|---|
| 学习新语法 | 让 AI 解释概念,给出例子 | 直接复制 AI 的答案交差 |
| 写 SQL | 先自己写,卡住了再问 AI | 完全让 AI 代写 |
| Debug | 先尝试理解报错,再问 AI | 每个报错都直接丢给 AI |
| 面试准备 | 用 AI 模拟面试、解释概念 | 依赖 AI,实际面试不会答 |
你可能会遇到的困难#
”学了很多,但不知道怎么用”#
这是最常见的问题。你看了很多教程,语法都会了,但面对真实问题还是不知道怎么下手。
解决方案:找真实项目练习。可以是公司的真实需求,也可以是自己找的公开数据集。比如:
- 用电商数据分析用户购买行为
- 用打车数据分析出行规律
- 用自己的微信支付记录分析消费习惯
关键是带着问题去分析,而不是漫无目的地”探索数据”。
“SQL 写不出来”#
很多新手面对需求时脑子一片空白,不知道怎么把业务问题翻译成 SQL。
解决方案:先用自然语言描述你要做什么,再翻译成 SQL。比如:
- 业务需求:“统计每个城市的订单量”
- 自然语言:“从订单表里,按城市分组,统计每组的数量”
- SQL:
SELECT city, COUNT(*) FROM orders GROUP BY city
多练几次,这个翻译过程就会变得自然。
“不知道学得够不够”#
总觉得自己学的不够,一直在看教程,不敢去面试或接真实项目。
解决方案:设一个明确的验收标准。当你能做到以下几点时,L1 阶段就算过关了:
- 能独立写出包含 JOIN 和 GROUP BY 的 SQL 查询
- 能用 Excel 透视表 5 分钟内完成一个基础分析
- 能用 Python 读取一个 CSV 文件,做简单的数据清洗和可视化
- 能看懂公司的基础数据报表,知道各个指标是什么意思
L1 阶段可以胜任的岗位#
完成 L1 阶段的学习后,你可以尝试以下岗位:
初级数据分析师 / 数据分析助理
- 主要工作:日常取数、制作报表、简单的数据异动分析
- 薪资参考:一线城市 8-15K,二线城市 6-10K
- 面试重点:SQL 能力、Excel 能力、对业务指标的理解
数据运营专员
- 主要工作:活动效果分析、用户数据监控、运营报告撰写
- 特点:需要更多业务 sense,技术要求相对低一些
业务分析岗(BI 方向)
- 主要工作:搭建和维护数据报表、仪表盘
- 特点:可能需要学习一些 BI 工具,如 Tableau、Power BI
[!note] 关于薪资的真诚建议 L1 阶段不要太纠结薪资。这个阶段最重要的是进入行业、积累经验。如果有两个 offer,一个薪资高但学不到东西,一个薪资低但有好的导师和成长空间,建议选后者。入门阶段的成长速度远比起薪重要。
给 L1 学习者的真诚建议#
1. 不要追求完美,先跑起来#
很多人学 Python 之前先纠结”该学 Python 2 还是 3”、“该用 Anaconda 还是原生安装”。这些都不重要。随便选一个,先跑起来,遇到问题再说。
2. 主动找机会实践#
如果你还在学校,找实习;如果你已经工作,主动找数据相关的活干。实践中学到的东西,比看十遍教程都有用。
3. 不要闭门造车#
加入一些数据分析的社群,看看别人在讨论什么问题。你会发现,很多你纠结的问题,别人早就遇到过了,而且有现成的解决方案。
4. 做一个作品集#
哪怕只是用公开数据做的练习项目,也整理成一个作品集。面试时能展示的东西,比简历上的”熟练使用 SQL”有说服力多了。
接下来#
当你能够熟练完成日常取数和基础分析,开始有这样的困惑时:
- “数据告诉我发生了什么,但我不知道为什么”
- “老板让我给建议,但我只会描述现状”
- “我想做更深入的分析,但不知道用什么方法”
恭喜你,你已经准备好进入下一个阶段了。
➡️ L2:实战进阶 ↗ —— 学习分析方法论,能够解释”为什么”
相关资源:
- 给不同阶段学习者的真诚建议 ↗ —— 找到适合你情况的学习建议
- Python学习路线图 ↗ —— 系统学习 Python
- SQL学习路线图 ↗ —— 系统学习 SQL
- 数据分析师求职全攻略 ↗ —— 准备面试