QBUS6600

QBUS6600 26S1|Assignment 1 的 EDA 做歪了 后面两个作业全跟着歪

包帕斯

作者

包帕斯

发布时间

2026-03-07

阅读参考

4 分钟 · 1987

QBUS6600 26S1|Assignment 1 的 EDA 做歪了 后面两个作业全跟着歪

QBUS6600 26S1|Assignment 1 的 EDA 做歪了 后面两个作业全跟着歪

📝 三个作业一条线——Capstone 的串联陷阱

QBUS6600 不是普通的选修课,是 Data Analytics for Business 方向的 Capstone。选课前提是你已经修完 QBUS5001、BUSS6002 在内的 18 学分专业课。这门课的定位很清楚:把前面学的东西拿出来用。

考核方式是三个 Assignment,没有 Final:

考核权重DDL类型
Assignment 130%Week 6个人 EDA + 报告
Assignment 240%Week 11小组建模 + 报告 + Presentation
Assignment 330%Week 13个人反思报告

看起来分散合理对吧?但这三个作业操作的是同一个 industry project 的同一个数据集。Assignment 1 做 EDA,Assignment 2 用 EDA 的发现去建模,Assignment 3 回头反思整个过程。前面的分析结论是后面的输入,不是三个独立的 deliverable。

💡 Week 6 交 EDA 报告——你只有5周时间搞定脏数据

Assignment 1 在 Week 6 截止,但你 Week 1 才第一次见到数据集。行业真实数据不会像 Kaggle 竞赛那样给你一个干净的 CSV,你需要花时间做 data cleaning、理解变量含义、处理缺失值。

与此同时,Week 2-5 的 lecture 在教 EDA、feature engineering、linear regression——这些内容你一边学一边就要用在 Assignment 1 上。不是"学完了再做",是"一边学一边做"。如果 Week 3 教 feature engineering 你没跟上,Week 6 交的 EDA 报告质量就会打折扣。

而这个折扣不止影响 30% 的分数。Assignment 2 的 group project 要基于所有组员的 EDA 发现来做 modeling strategy,你的 EDA 洞见不够深,整个组的分析起点就低了。

🎬 40% 的 Group Project:不只是建模,还要讲给"老板"听

Assignment 2 要求你的团队做三件事:

  1. 综合所有人的 EDA 发现
  2. 用 ML 模型回答行业问题
  3. 写一份包含 executive summary 的报告 + 录制 presentation

Executive summary 这个要求说明评分不只看技术。你的报告读者是"decision makers or business audience"——他们不关心你用了几层 Random Forest,关心的是"所以我该怎么做"。

很多 Data Analytics 方向的学生技术能力没问题,但把分析结论翻译成商业建议是另一回事。这也是为什么这门课是 Capstone——它考的是你能不能把 QBUS5001 和 BUSS6002 的技术和商业思维合在一起用。

💰 AI 全部允许——但反思报告得靠自己想

三个 Assignment 都标注了"AI allowed",这在 QBUS/BUSS 系列课程里不算常见。但 AI 在这门课里的天花板很明显:

  • EDA:AI 可以帮你写 cleaning 代码,但判断哪些 patterns 对业务有价值需要你理解行业背景
  • 建模:AI 可以帮你跑 XGBoost,但 model selection 的理由需要你自己论证
  • 反思报告:AI 可以帮你组织语言,但"你遇到了什么困难、为什么做了那个选择"只有你自己知道

Assignment 3 的反思报告是这门课最容易被低估的部分。30% 的权重,要求 critical reflection——不是写"我们小组配合很好",是要说清楚"什么决策是错的、如果重来怎么改"。大多数人到 Week 13 已经精疲力尽,随便写几页交差,但这恰恰是区分 D 和 HD 的地方。

⚠️ Week 10 学完 Boosting,Week 11 就要交建模报告

前10周的课程密度非常高:EDA → Regression → Clustering → Logistic Regression → Model Selection → Regularization → Decision Trees → Random Forest → Boosting。每周一个新模型,没有任何缓冲周

Week 11-13 切换为 Guest Lectures 模式,不再教新内容。但 Assignment 2 的 DDL 就在 Week 11。也就是说你 Week 10 刚学完 tree-based methods(Boosting 和 XGBoost),Week 11 的报告就要交了。中间只有一周的消化时间。

如果你打算用 ensemble methods 做最终建模,你得在 Week 9-10 的课上同时理解原理 + 应用到项目数据上 + 跟组员协调分工。三件事并行,时间窗口非常窄。

相关课程

QBUS6600大东资料库 | 作业攻略/Lec精讲 按需选购

QBUS6600大东资料库 | 作业攻略/Lec精讲 按需选购

讲师
包帕斯
学院
USYD
购买项
5
价格
A$39.80 ~ A$199.80
查看课程详情

相关推荐