拾穗数据

Back

数据分析师 L1:入门筑基#

[!quote] 写在前面 如果你正在读这篇文档,说明你对数据分析产生了兴趣,或者已经决定往这个方向发展。不管你现在是什么背景——在校学生、刚毕业的应届生、想转行的职场人,还是想给自己加一项技能的业务人员——我都想先告诉你一件事:你选择了一个正确的方向

数据分析不是什么高不可攀的技术,它本质上是一种用事实说话的思维方式。这篇文档会尽可能真诚地告诉你,在入门阶段你需要学什么、会遇到什么困难、以及如何避开我们踩过的坑。


这个阶段的你,可能是这样的#

在开始学习之前,我想先描述几个典型的 L1 学习者画像。看看有没有和你相似的:

画像一:在校学生,想找份数据相关的工作#

你可能是大三大四的学生,专业可能是统计、经济、计算机,也可能完全不相关。你听说数据分析师是个不错的岗位,薪资还可以,门槛也不像程序员那么高。但你打开招聘网站,发现要求写着”熟练使用 SQL”、“精通 Python”、“有数据分析经验”,你有点慌——这些你都不太会。

给你的建议:不要被招聘要求吓到。那些”精通”往往是 HR 的模板用语。L1 阶段你需要做的就是:能用 SQL 从数据库里把数据取出来,能用 Excel 或 Python 做基本的数据处理和图表。这两件事,认真学 2-3 个月完全可以做到。

画像二:刚入职的新人,工作中需要用到数据#

你可能刚入职一家公司,岗位是运营、产品、市场,甚至是销售。老板经常让你”拉个数据”、“做个分析”,你发现 Excel 透视表已经不够用了,同事们都在用一个叫 SQL 的东西从”数据库”里取数。你想学,但不知道从哪开始。

给你的建议:你的优势是有真实的业务场景。很多人学数据分析最大的困难是”不知道分析什么”,而你天天都有真实问题要解决。建议你从 SQL 开始学起,因为这是最快能在工作中用上的技能。学的时候直接用公司的数据练习(注意权限),进步会非常快。

画像三:想转行,但对自己的能力没信心#

你可能已经工作了几年,做的是和数据完全不相关的工作。你想转行,看了很多帖子,有人说”零基础三个月转行成功”,也有人说”没有统计学背景很难”。你不知道该信谁,也不确定自己能不能学会。

给你的建议:转行确实需要付出更多努力,但绝对不是不可能。数据分析的入门门槛没有你想象的那么高。我见过文科背景、完全零基础的人,通过半年的系统学习成功转行。关键是:不要只看教程,要动手做项目。哪怕是用公开数据集做一个分析,也比看十个视频有用。


L1 阶段的核心目标#

用一句话概括 L1 阶段的目标:

能够独立完成”发生了什么”这个层面的分析。

具体来说,就是:

  • 业务方问你”上周的销售额是多少”,你能从数据库里查出来
  • 老板说”做个用户画像”,你能用数据描述出用户的基本特征
  • 产品问”这个功能上线后数据怎么样”,你能拉出数据做个前后对比

注意,L1 阶段不要求你解释”为什么会这样”(那是 L2 的事),也不要求你预测”接下来会怎样”(那是 L3 的事)。你的任务就是:准确地描述事实


必须掌握的核心技能#

1. SQL —— 最重要的技能,没有之一#

我把 SQL 放在第一位,因为它真的是数据分析师吃饭的家伙。不管你在什么公司、什么行业,只要做数据分析,就一定要用 SQL 从数据库里取数。

需要掌握到什么程度?

L1 阶段,你需要能够:

  • SELECT ... FROM ... WHERE 基础查询
  • GROUP BY 做分组统计
  • JOIN 连接多张表
  • ORDER BY 排序,用 LIMIT 限制结果数量

就这些。不需要写存储过程,不需要懂数据库优化,不需要会窗口函数(那是 L2 的内容)。

推荐的学习路径

  1. 先学基础语法:SQL基本概念SELECT语句结构WHERE条件筛选
  2. 学会聚合统计:聚合函数详解 → [GROUP BY分组](https://pro.ss-data.cc/knowledge/12-GROUP BY分组)
  3. 学会多表查询:JOIN连接 —— 这是 L1 阶段最难的部分,但也是最重要的

[!warning] 新手最常犯的错误 不要在生产数据库直接运行 SELECT *,尤其是对大表。我见过新人这样拉数,直接把数据库搞崩了,整个公司的系统都受影响。养成习惯:先 SELECT COUNT(*) 看看有多少条数据,再决定怎么取。

怎么练习?

最好的方式是用真实数据。如果公司有数据权限,就用公司的数据练(当然要遵守数据安全规定)。如果没有,可以用公开数据集,比如 Kaggle 上的数据,导入到本地 MySQL 里练习。

2. Excel / Google Sheets —— 不要小看它#

很多人觉得 Excel 太 low,学数据分析就应该直接学 Python。这是个误区。

Excel 的优势是。老板让你 5 分钟内给个数据,你打开 Excel 透视表几下就搞定了;如果你非要用 Python,等你把环境配好、代码写完,老板早就等不及了。

L1 阶段需要掌握的 Excel 技能

  • 透视表(Pivot Table):这是 Excel 最强大的功能,必须熟练
  • VLOOKUP / XLOOKUP:用于多表关联
  • 基础图表:柱状图、折线图、饼图
  • 条件格式:快速发现数据中的异常

什么时候用 Excel,什么时候用 Python?

一个简单的判断标准:

  • 数据量在 10 万行以内,用 Excel 通常更快
  • 数据量超过 10 万行,或者需要重复处理,用 Python
  • 需要快速给非技术人员展示,用 Excel
  • 需要做复杂的数据清洗或建模,用 Python

3. Python + Pandas —— 入门即可#

L1 阶段对 Python 的要求不高。你不需要成为 Python 程序员,只需要会用 Pandas 这个库做基本的数据处理。

需要掌握的内容

  • Python 基础语法:变量、循环、函数(不需要太深)
  • Pandas 的基本操作:读取数据、筛选、分组、合并
  • 基础可视化:用 Matplotlib 或 Seaborn 画图

推荐学习路径

Python学习路线图环境搭建基础语法Pandas数据结构Pandas数据操作

[!tip] 学 Python 的正确姿势 不要花太多时间在语法细节上。很多人学 Python 花了一个月还在纠结”列表和元组有什么区别”,这就跑偏了。数据分析用的 Python 语法非常有限,你只需要会用 Pandas 处理数据就行。遇到不会的语法,随用随查。

4. 数据思维 —— 容易被忽视但很重要#

技术可以速成,但思维需要慢慢培养。什么是数据思维?简单说就是:

  • 用数据说话,而不是用感觉:不说”我觉得用户喜欢这个功能”,而说”数据显示这个功能的使用率是 35%”
  • 会问正确的问题:老板说”分析一下用户”,你要能追问”您想了解用户的哪个方面?是活跃度、付费还是留存?”
  • 对数字敏感:看到”转化率提升了 50%“,你会想”基数是多少?是从 2% 提升到 3%,还是从 20% 提升到 30%?”

推荐阅读数据思维基础批判性思维

5. AI 工具 —— 你的新学习伙伴#

2024 年之后入行的数据分析师,有一个前辈们没有的优势:AI 助手

ChatGPT、Claude、GitHub Copilot 这些工具,正在改变数据分析的学习和工作方式。L1 阶段,你应该学会把 AI 当作学习伙伴:

AI 可以帮你做什么?

  1. 解释代码和概念
你:这段 SQL 是什么意思?
SELECT user_id, COUNT(*) FROM orders GROUP BY user_id HAVING COUNT(*) > 5

AI:这段 SQL 的意思是:从 orders 表中,按 user_id 分组,
统计每个用户的订单数量,只保留订单数大于 5 的用户。
plaintext
  1. 帮你写 SQL
你:帮我写一个 SQL,统计每个月的新增用户数

AI:SELECT DATE_FORMAT(register_time, '%Y-%m') as month,
    COUNT(DISTINCT user_id) as new_users
FROM users
GROUP BY DATE_FORMAT(register_time, '%Y-%m')
ORDER BY month;
plaintext
  1. Debug 和优化:当你的 SQL 报错或跑得很慢,可以把代码贴给 AI,让它帮你找问题。

但 AI 不能替代你做什么?

  • 理解业务:AI 不知道你们公司的”活跃用户”是怎么定义的
  • 判断结果是否合理:AI 给你的 SQL 可能语法正确但逻辑错误
  • 提出正确的问题:AI 只能回答问题,不能帮你想出该问什么问题
  • 沟通和汇报:最终还是要你来给老板讲清楚数据说明了什么

[!warning] AI 时代的学习建议 不要因为有 AI 就跳过基础学习。如果你完全不懂 SQL,AI 给你的代码你也看不懂、改不了、不知道对不对。正确的姿势是:先学基础,再用 AI 提效。把 AI 当作”随时可以请教的师兄”,而不是”替你做作业的外挂”。

推荐的 AI 使用方式

场景推荐做法不推荐做法
学习新语法让 AI 解释概念,给出例子直接复制 AI 的答案交差
写 SQL先自己写,卡住了再问 AI完全让 AI 代写
Debug先尝试理解报错,再问 AI每个报错都直接丢给 AI
面试准备用 AI 模拟面试、解释概念依赖 AI,实际面试不会答

你可能会遇到的困难#

”学了很多,但不知道怎么用”#

这是最常见的问题。你看了很多教程,语法都会了,但面对真实问题还是不知道怎么下手。

解决方案:找真实项目练习。可以是公司的真实需求,也可以是自己找的公开数据集。比如:

  • 用电商数据分析用户购买行为
  • 用打车数据分析出行规律
  • 用自己的微信支付记录分析消费习惯

关键是带着问题去分析,而不是漫无目的地”探索数据”。

“SQL 写不出来”#

很多新手面对需求时脑子一片空白,不知道怎么把业务问题翻译成 SQL。

解决方案:先用自然语言描述你要做什么,再翻译成 SQL。比如:

  • 业务需求:“统计每个城市的订单量”
  • 自然语言:“从订单表里,按城市分组,统计每组的数量”
  • SQL:SELECT city, COUNT(*) FROM orders GROUP BY city

多练几次,这个翻译过程就会变得自然。

“不知道学得够不够”#

总觉得自己学的不够,一直在看教程,不敢去面试或接真实项目。

解决方案:设一个明确的验收标准。当你能做到以下几点时,L1 阶段就算过关了:

  1. 能独立写出包含 JOIN 和 GROUP BY 的 SQL 查询
  2. 能用 Excel 透视表 5 分钟内完成一个基础分析
  3. 能用 Python 读取一个 CSV 文件,做简单的数据清洗和可视化
  4. 能看懂公司的基础数据报表,知道各个指标是什么意思

L1 阶段可以胜任的岗位#

完成 L1 阶段的学习后,你可以尝试以下岗位:

初级数据分析师 / 数据分析助理

  • 主要工作:日常取数、制作报表、简单的数据异动分析
  • 薪资参考:一线城市 8-15K,二线城市 6-10K
  • 面试重点:SQL 能力、Excel 能力、对业务指标的理解

数据运营专员

  • 主要工作:活动效果分析、用户数据监控、运营报告撰写
  • 特点:需要更多业务 sense,技术要求相对低一些

业务分析岗(BI 方向)

  • 主要工作:搭建和维护数据报表、仪表盘
  • 特点:可能需要学习一些 BI 工具,如 Tableau、Power BI

[!note] 关于薪资的真诚建议 L1 阶段不要太纠结薪资。这个阶段最重要的是进入行业、积累经验。如果有两个 offer,一个薪资高但学不到东西,一个薪资低但有好的导师和成长空间,建议选后者。入门阶段的成长速度远比起薪重要。


给 L1 学习者的真诚建议#

1. 不要追求完美,先跑起来#

很多人学 Python 之前先纠结”该学 Python 2 还是 3”、“该用 Anaconda 还是原生安装”。这些都不重要。随便选一个,先跑起来,遇到问题再说。

2. 主动找机会实践#

如果你还在学校,找实习;如果你已经工作,主动找数据相关的活干。实践中学到的东西,比看十遍教程都有用。

3. 不要闭门造车#

加入一些数据分析的社群,看看别人在讨论什么问题。你会发现,很多你纠结的问题,别人早就遇到过了,而且有现成的解决方案。

4. 做一个作品集#

哪怕只是用公开数据做的练习项目,也整理成一个作品集。面试时能展示的东西,比简历上的”熟练使用 SQL”有说服力多了。


接下来#

当你能够熟练完成日常取数和基础分析,开始有这样的困惑时:

  • “数据告诉我发生了什么,但我不知道为什么”
  • “老板让我给建议,但我只会描述现状”
  • “我想做更深入的分析,但不知道用什么方法”

恭喜你,你已经准备好进入下一个阶段了。

➡️ L2:实战进阶 —— 学习分析方法论,能够解释”为什么”


相关资源

数据分析师 L1:入门筑基
https://blog.ss-data.cc/blog/data-analyst-l1-foundation
Author 石头
Published at 2025年1月5日
Comment seems to stuck. Try to refresh?✨