QBUS6600 26S1|Assignment 1 的 EDA 做歪了 后面两个作业全跟着歪
📝 三个作业一条线——Capstone 的串联陷阱
QBUS6600 不是普通的选修课,是 Data Analytics for Business 方向的 Capstone。选课前提是你已经修完 QBUS5001、BUSS6002 在内的 18 学分专业课。这门课的定位很清楚:把前面学的东西拿出来用。
考核方式是三个 Assignment,没有 Final:
| 考核 | 权重 | DDL | 类型 |
|---|---|---|---|
| Assignment 1 | 30% | Week 6 | 个人 EDA + 报告 |
| Assignment 2 | 40% | Week 11 | 小组建模 + 报告 + Presentation |
| Assignment 3 | 30% | Week 13 | 个人反思报告 |
看起来分散合理对吧?但这三个作业操作的是同一个 industry project 的同一个数据集。Assignment 1 做 EDA,Assignment 2 用 EDA 的发现去建模,Assignment 3 回头反思整个过程。前面的分析结论是后面的输入,不是三个独立的 deliverable。
💡 Week 6 交 EDA 报告——你只有5周时间搞定脏数据
Assignment 1 在 Week 6 截止,但你 Week 1 才第一次见到数据集。行业真实数据不会像 Kaggle 竞赛那样给你一个干净的 CSV,你需要花时间做 data cleaning、理解变量含义、处理缺失值。
与此同时,Week 2-5 的 lecture 在教 EDA、feature engineering、linear regression——这些内容你一边学一边就要用在 Assignment 1 上。不是"学完了再做",是"一边学一边做"。如果 Week 3 教 feature engineering 你没跟上,Week 6 交的 EDA 报告质量就会打折扣。
而这个折扣不止影响 30% 的分数。Assignment 2 的 group project 要基于所有组员的 EDA 发现来做 modeling strategy,你的 EDA 洞见不够深,整个组的分析起点就低了。
🎬 40% 的 Group Project:不只是建模,还要讲给"老板"听
Assignment 2 要求你的团队做三件事:
- 综合所有人的 EDA 发现
- 用 ML 模型回答行业问题
- 写一份包含 executive summary 的报告 + 录制 presentation
Executive summary 这个要求说明评分不只看技术。你的报告读者是"decision makers or business audience"——他们不关心你用了几层 Random Forest,关心的是"所以我该怎么做"。
很多 Data Analytics 方向的学生技术能力没问题,但把分析结论翻译成商业建议是另一回事。这也是为什么这门课是 Capstone——它考的是你能不能把 QBUS5001 和 BUSS6002 的技术和商业思维合在一起用。
💰 AI 全部允许——但反思报告得靠自己想
三个 Assignment 都标注了"AI allowed",这在 QBUS/BUSS 系列课程里不算常见。但 AI 在这门课里的天花板很明显:
- EDA:AI 可以帮你写 cleaning 代码,但判断哪些 patterns 对业务有价值需要你理解行业背景
- 建模:AI 可以帮你跑 XGBoost,但 model selection 的理由需要你自己论证
- 反思报告:AI 可以帮你组织语言,但"你遇到了什么困难、为什么做了那个选择"只有你自己知道
Assignment 3 的反思报告是这门课最容易被低估的部分。30% 的权重,要求 critical reflection——不是写"我们小组配合很好",是要说清楚"什么决策是错的、如果重来怎么改"。大多数人到 Week 13 已经精疲力尽,随便写几页交差,但这恰恰是区分 D 和 HD 的地方。
⚠️ Week 10 学完 Boosting,Week 11 就要交建模报告
前10周的课程密度非常高:EDA → Regression → Clustering → Logistic Regression → Model Selection → Regularization → Decision Trees → Random Forest → Boosting。每周一个新模型,没有任何缓冲周。
Week 11-13 切换为 Guest Lectures 模式,不再教新内容。但 Assignment 2 的 DDL 就在 Week 11。也就是说你 Week 10 刚学完 tree-based methods(Boosting 和 XGBoost),Week 11 的报告就要交了。中间只有一周的消化时间。
如果你打算用 ensemble methods 做最终建模,你得在 Week 9-10 的课上同时理解原理 + 应用到项目数据上 + 跟组员协调分工。三件事并行,时间窗口非常窄。






