概览

定位与使用方法

本附录不是一份系统的 Python 语法教程。你不需要背语法,不需要记函数名。

本附录只做一件事:帮你用准确的专业语言,指挥 AI 工具生成可运行的 Python 代码。

同样是让 AI 清洗数据,下面两种提示词的效果差距巨大:

❌ 「帮我清洗一下数据」

✅ 「我有一个 pandas 数据框 df,包含 datestock_codereturn 三列,其中 return 列有缺失值。请用前向填充法处理缺失值,将 date 列转换为 datetime 类型,最后按 stock_codedate 升序排列。」

差别只有一个:第二种用了 Python 专业术语。有了这些词,AI 才知道你的数据结构、处理目标和技术偏好。本附录的核心任务,就是帮你积累这套词汇,并给出可以直接套用的提示词框。

最重要的心智模型:与 AI 的对话是迭代过程

初学者最常见的误区是:期待一次提示词生成完美代码。这几乎不可能发生。

真实的工作流是这样的:

第 1 轮  描述任务背景 + 数据结构
         → AI 生成基础代码,能跑通
            ↓
第 2 轮  「代码报错」或「结果不对」
         → 贴上错误信息或具体问题,继续追问
            ↓
第 3 轮  「结果对了,但图不好看」或「表格太乱」
         → 用微调提示词修细节
            ↓
第 4 轮  「这段代码太慢」或「想理解这行代码」
         → 优化 / 解释提示词

因此,本附录中的每一个提示词框,都设计为两层结构

  • 第一层(主提示词):生成基础代码
  • 第二层(追问模板):根据第一轮的结果,选择合适的追问方式继续迭代

管理 AI 的上下文记忆也很重要。 当对话变长,或你开启了新的对话窗口,AI 会「忘记」你之前说过的数据结构和变量名,导致生成的代码和前文对不上。解决方法见 A8. 上下文管理与调试

章节安排

章节 主题 核心收获
A1. 环境配置 包安装、路径、常见报错 能向 AI 描述你的运行环境
A2. 项目规划与 Git 项目结构、GitHub 同步 建立可复现的分析项目
A3. 提示词核心词汇 数据类型、数据结构术语 写出 AI 能理解的提示词
A4. 数据获取与清洗 读取、清洗、合并、变换 数据处理类提示词模板
A5. 数据可视化 图形要素、风格、金融专题图 可视化类提示词模板
A6. 统计建模 回归、机器学习、模型评估 建模类提示词模板
A7. 结果呈现与表格 Notebook 输出、表格美化、导出 让结果好看、可汇报
A8. 上下文管理与调试 验证结果、报错处理、代码加速 遇到问题时怎么问 AI

建议使用方式:

  1. 先读完本页,建立迭代工作流的心智模型
  2. 通读 A3,掌握核心专业词汇
  3. 按需查阅 A4–A7 中的提示词框,稍作修改即可使用
  4. 遇到报错或结果不对,直接跳到 A8

推荐参考资料

为了能够写出逻辑清晰、表述准确的提示词,建议大家抽空翻看一下有关 Python 基本语法、数据分析流程相关书籍,理解常用的概念和框架。

Python 语言基础

  • Downey, A. (2024). Think Python: How to Think Like a Computer Scientist (3rd ed.). O’Reilly. 在线阅读 | PDF
    • Python 入门首选,通俗易懂,适合零基础读者
  • Johansson, R. (2024). Numerical Python: Scientific Computing and Data Science Applications with NumPy, SciPy and Matplotlib (3rd ed.). Apress. 链接 | github
    • 覆盖科学计算、绘图、统计与机器学习初步;第 4 章系统介绍 matplotlib 绘图元素

Python 数据分析

  • McKinney, W. (2022). Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter (3rd ed.). O’Reilly. 在线阅读 | github
    • pandas 作者亲写,数据处理最权威的参考书
  • VanderPlas, J. (2023). Python Data Science Handbook (2nd ed.). O’Reilly. 在线阅读 | github
    • 数据分析 + 可视化 + 机器学习,提供 Colab 版本,可直接在线运行
  • QuantEcon. 网站 | github
    • 面向经济与金融的开源计算教程,内容持续更新

金融数据分析

  • Scheuch, C., Voigt, S., Weiss, P., & Frey, C. (2024). Tidy Finance with Python (1st ed.). Chapman and Hall/CRC. 在线阅读 | github
    • 涵盖股票回报、CAPM、投资组合、Fama-French 因子模型等金融核心主题
  • Hilpisch, Y. (2019). Python for Finance: Mastering Data-Driven Finance (2nd ed.). O’Reilly. PDF | github
    • 量化金融方向,覆盖期权定价、风险管理、算法交易
  • Jansen, S. (2020). Machine Learning for Algorithmic Trading (2nd ed.). 网站 | github
    • 机器学习在算法交易中的应用,案例丰富