Day 9

海外运营 × Codex 训练营

销售线索评分
+ CRM 集成

把 CRM / 预约工具 / 官网表单 3 来源的线索合并去重，让 Codex 做自动评分，再推回 CRM 触发跟进。

讲师 Terrence 时长 90 分钟产物跑通 50 条线索评分 + CRM 标签同步

Day 9 · 开场

今天结束，你能做到

说清楚线索评分（lead scoring）的 4 维模型：行业 / 公司规模 / 沟通信号 / 意向词
让 Codex 写一个工具：统一收集 CRM + 预约工具 + 官网表单，去重后打分
用 CRM 接口自动标 hot / warm / cold，触发跟进任务或 nurturing 邮件序列
用 50 条脱敏线索跑通完整链路，并产出一份周报

本节关键判断：评分模型不是越复杂越好——4 维 × 25 分 = 100 分是行业 baseline，先跑通再调权重。

Day 9 · 痛点

为什么"线索散在一堆工具里"是销售第一杀手

79%

B2B 线索从来没被销售跟进过，因为它没出现在销售当天打开的那个工具里

5×

5 分钟内联系新线索 vs 30 分钟后联系，成单率差 5 倍（MIT 经典研究）

23h

销售平均每周花在手动整理线索数据上的时间——这是 AI 该接管的

意味着：你不缺线索，缺的是把线索按优先级排出来的人——而这件事 Codex 一个工具就能干完。

Day 9 · 漏斗

海外运营常见的 3 类线索来源

1

主动来询 · 官网 contact form（Webflow / Framer / Typeform）

高意向

2

预约日历 · 预约工具 / SavvyCal / Cal.com 通过邮件通知

高意向

3

CRM 沉淀 · 把线索存进你的 CRM

需重新评估

4

冷邮件回复（ / Lemlist / Instantly 群发后回复）

中意向

5

LinkedIn DM / Sales Navigator 互动

中意向

6

线下展会扫码 / 名片（手动导入）

需清洗

今天聚焦前 3 类——这是 SaaS / 出海 B2B 团队覆盖率最高、API 最成熟的来源。

Day 9 · 模型

Lead Scoring 模型 · 4 × 25 = 100 分

维度 1 · 行业匹配（25 分）

SaaS / 电商 / 金融 = 25 分。教育 / 制造 / 医疗 = 15 分。其他 = 5 分。

→ 用公司邮箱域名反查行业（Clearbit / enrich）。

维度 2 · 公司规模（25 分）

1000+ 员工 = 25。100-1000 = 20。10-100 = 12。1-10 = 5。

→ LinkedIn employee count，CRM enrich 自带。

维度 3 · 沟通信号（25 分）

邮件提到具体业务 + 12 分，提到价格 + 8 分，提到Demo / 试用 + 5 分。

→ Codex 用关键词 + LLM 做语义判定。

维度 4 · 意向词频率（25 分）

"price" / "demo" / "urgent" / "buy" 出现 1 次 +6，3 次以上封顶 25 分。

→ 正则匹配 + 词频统计，最便宜的一维。

为什么先用 25/25/25/25 等权？等权是 baseline，跑 2 个月有数据后再调权重——比一开始猜权重靠谱。

Day 9 · Prompt

今天的核心 Prompt（一字不差喂给 Codex）

桌面上有 3 个来源的销售线索导出文件，列名各不一样： - crm_export.csv（CRM 沉淀，邮箱列叫 Email） - calendar_bookings.csv（预约工具，邮箱列叫 attendee_email） - website_form.csv（官网表单，邮箱列叫 work_email）帮我： 1) 把这 3 个文件汇总到一起，按邮箱（统一小写）去重，同一人多来源时合并字段； 2) 按 4 个维度各 25 分打分（满分 100）：行业匹配、公司规模、沟通信号、意向词； 3) 总分>70 的标成 hot lead 并安排跟进； 4) 按分数从高到低排序，给销售一份优先名单。

📎 本页底部「实操素材」可下载这 3 个文件 —— 列名故意做得不一样，正是为了练第 1 步「按邮箱合并去重」。

Day 9 · Prompt

为什么 Prompt 长成这样？拆 6 个动作

1

声明输入 · 把 3 个来源 + 文件路径写清楚Codex 看到具体路径才会写真实代码，模糊"邮件附件"会让它假设结构

2

去重逻辑 · 按邮箱合并 + 保留最早接触时间"按邮箱"是关键词，否则 Codex 会按 name 去重导致同名公司丢数据

3

评分规则量化 · 不写"SaaS 优先" → 写 "SaaS = 25 分"量化规则让 Codex 直接生成可执行代码，模糊描述会让它生成空函数

4

分档动作 · 每档明确"要在 CRM 干什么"hot → 创建 task；warm → 加 list；cold → 加 tag。Codex 会自动查 CRM 接口文档

5

报告需求 · "周报 · 来源转化率 · TOP 10"这是给老板看的，不是销售。明确受众 Codex 才知道格式

6

工程约束 · 安全存放的配置 / idempotent / 日志 / README这样结果才稳、能长期用

Day 9 · 分档

3 档线索 · 不同动作

HOT · 70-100 分

销售当天联系

CRM 标 'hot lead' 标签
自动创建 task 派给 AE
团队群 #sales-hot 频道 @相应销售
预约工具链接直接私信

→ 5 分钟响应窗口

WARM · 40-70 分

nurturing 序列

CRM 标 'warm' 标签
加入 7 封自动邮件序列
每周生成 case study 投递
2 周后重新打分

→ 教育 → 转 hot

COLD · 0-40 分

季度 review

CRM 标 'cold' 标签
放入归档列表
季度初批量重打分
避免销售浪费时间

→ 不主动跟进

关键设计：cold 不等于"扔掉"。季度重打分——因为公司可能 6 个月后融资 / 招人 / 转型，状态会变。

Day 9 · 数据流

完整数据流 · 从原始线索到销售桌面

1

Ingest · CRM 接口 + 预约工具 .eml + Webflow CSV → data/raw/每个来源独立模块，独立失败不影响其他

2

Dedupe · 按 email 合并 → data/merged.csv同一人多来源时合并字段，保留最早 first_touch 时间

3

Enrich · 调 Clearbit / 补齐行业 + 公司规模缓存 enrich 结果，避免重复 API 消耗

4

Score · 4 维评分 → data/scored.csv每条记录带 breakdown，方便人工审查

5

Push · 回写 CRM lead_score + lifecyclestage + tagidempotent：重跑不会重复创建 task

6

Notify · Hot lead → 团队群 / 邮件即时通知销售5 分钟响应窗口的关键

7

Report · 每周一早 9 点生成上周线索质量周报Markdown → 邮件给老板

Day 9 · 周报

每周线索质量周报（Markdown）

# 线索周报 · Week 21 (2026-05-19 ~ 2026-05-25) ## 总览 - 新线索：247 条（↑18% vs 上周） - Hot (70+)：23 条 · 转化中：12 (52%) - Warm (40-70)：89 条 · nurturing 中 - Cold (<40)：135 条 ## 各来源转化率 | 来源 | 新增 | Hot 率 | 平均分 | |------|------|--------|--------| | 官网 contact form | 42 | 31% | 58 | | 预约工具 | 18 | 67% | 71 | ← 最优 | CRM 沉淀 | 187 | 4% | 28 | ## TOP 10 高分线索 1. Sarah Chen · 支付渠道 (Finance, 8000+) · 88 分 · "ready to buy this Q" 2. Marcus Webb · Linear (SaaS, 200) · 84 分 · 已 booked demo 3. ... ## 洞察 - 预约工具来源 Hot 率 67%，应加大投放 - 官网表单的 industry enrich 失败率 12%，需修 - CRM 沉淀池 4% Hot 率偏低，建议清洗后重打分

Day 9 · 避坑

Lead Scoring · 4 个常见误区

误区 1 · 维度太多

15 维评分模型听起来牛，实际跑不通也调不动——每个维度都要数据 + 阈值 + 监控。

→ 4 维 baseline，3 个月后再加。

误区 2 · 等权迷信

跑 3 个月有真实转化数据后，必须重训权重。继续等权就是浪费数据。

→ 看哪一维和成单相关性最高，加权。

误区 3 · 没有人工 override

销售从经验判断"这个 30 分的其实是大单"——工具必须支持手动标 hot 并记录原因。

→ AI 是辅助，不是裁判。

误区 4 · 不监控漂移

3 个月后行业关键词变了（比如"AI agent"火了），不更新词库 → 分数失真。

→ 月度 review 关键词命中率。

核心原则：Lead scoring 是活的系统，不是装一次的工具。3 个月不维护就开始漂移。

Day 9 · 实操

现在轮到你

学员练习
50 条脱敏线索跑通

讲师准备了 50 条脱敏线索 CSV（混合 3 来源）
用 Codex 把今天的 prompt 跑一遍，
最终在 CRM Free 上看到 hot / warm / cold 标签

CSV 已发群 CRM Free 当场注册 90 分钟时长完成 = 拿到今天产物

Day 9 · 实操

练习步骤 · 跟着做

注册 CRM Free · hubspot.com → Free CRM → 注册 → Settings → Integrations → Private Apps → 创建
下载 CSV · 群里发的 day09_leads.csv · 50 条脱敏数据
新建工作目录 · mkdir ~/lead-scoring && cd ~/lead-scoring
启动 Codex CLI · codex 然后把 SLIDE 7 的完整 prompt 喂进去
盯着 Codex 干活 · 它会问你 API key 放哪、是否创建 .gitignore——确认即可
运行 · 让 Codex 跑一次：给线索打分并同步
验收 · 打开 CRM → Contacts → 看到 50 条记录 + lead_score + lifecyclestage 标签
生成周报 · 周报这步 --week current → 输出 Markdown

Day 9 · 调试

常见报错 · 3 类

1

401 Unauthorized · CRM 接口 key 没权限→ 回 Private App 检查 scope，必须勾 crm.objects.contacts.read 和 write

2

429 Rate Limit · 调用太快被限流→ Codex 应该自动加了 retry，看 logs 确认有 backoff；没有就让 Codex 加 time.sleep(0.5)

3

KeyError: 'email' · CSV 列名不匹配→ 让 Codex 加 column rename mapping，或者改 CSV 表头

4

Clearbit 返回 None · enrich 失败→ 加 fallback：industry = 默认值；保留原始记录不要丢

5

Task 重复创建 · 工具不是 idempotent→ 让 Codex 加"先查 task 是否已存在再创建"逻辑

调试技巧：把报错原样粘给 Codex，加一句"修复并重跑"——比自己 Google 快 10 倍。

Day 9 · 进阶

进阶 · 一句话切换 CRM /

跑通 CRM 后，让 Codex 加一层抽象 → 切换 CRM 只改一个环境变量。

我用的 CRM 不一样，帮我把上面这套线索评分接到我自己的 CRM 上（我的 CRM 是：____）。我不懂技术，你直接帮我弄好，并告诉我需要提供什么、在哪里填。

跑完这一段，你团队明年换 CRM 时省下的工作量足够回本整个训练营。

Day 9 · 部署

把工具部署成定时任务

1

方案 A · 定时自动运行 · 推到 private repo + 安全存放的配置走 secrets每天凌晨 4 点定时跑一次。完全免费（公网仓库 2000 分钟 / 月）

2

方案 B · Vercel Cron · 适合配合 Next.js dashboard 一起部署免费版每天 1 次调用，付费 $20/mo 无限

3

方案 C · 本地定时 · macOS launchd / Linux 定时tab开发期最快，但电脑得开机——只适合个人 PoC

4

方案 D · 云服务器 · 阿里云 / DO / AWS t3.micro$5-10/mo，自己的服务器上定时运行，最稳定

推荐：team 用定时自动运行（零运维），个人 PoC 用本地定时（最快），需要 dashboard 配套就上 Vercel。

Day 9 · 合规

合规 · 4 件你不能不管

GDPR · 欧盟客户：必须保留 consent 记录，contact form 加复选框"我同意接收营销邮件"
CCPA · 加州客户：用户有"被遗忘权"，工具要支持按 email 删除全部记录
CAN-SPAM · 美国邮件：每封自动邮件必须有 unsubscribe 链接 + 物理地址
PIPL · 中国：跨境传输个人数据需要明示告知；中国客户数据建议本地化存储

实操建议：让 Codex 在去重这步里加一个 consent_check()，没有 consent 记录的 email 不进 nurturing 序列——分进 pool 但不主动联系。罚款一次能花掉一年广告预算。

Day 9 · 验收

今日成果 · 4 项验收清单

✓

CRM Free 账号注册完成 · API key 拿到 + 存在安全存放的配置验收：echo $密钥 能输出

✓

Codex 生成的 lead-scoring/ 目录跑通 · 50 条记录已评分验收：cat data/scored.csv | head 看到分数 + breakdown

✓

CRM Contacts 看到标签 · hot/warm/cold 分布合理验收：登录 CRM → Contacts → 按 lead_score 排序

✓

周报 Markdown 生成成功 · 含来源转化率 + TOP 10验收：cat reports/week_21.md

下课前 5 分钟：把你的周报截图发训练营群——讲师当晚逐条 review。

Day 9 · 小结

今天 3 个 takeaway

Lead scoring 是销售注意力预算——4 维 × 25 分 = 100 分是 baseline，跑通再调权重
Codex 把"概念 demo"拆成"可维护代码"——7 个模块独立可测，换 CRM 只改一个文件
评分系统是活的——3 个月不维护就漂移，月度 review 关键词 + 季度重训权重

课后作业（明天前完成）：把你真实工作里的 100 条线索（脱敏后）跑一次评分，看 TOP 10 是不是你心里的 TOP 10——不一致的部分就是模型还要调的方向。

Day 9 · 实操素材

📦 本节素材 + 对 Codex 说的话

不用写代码——把下面这段话（按需替换尖括号里的内容）发给 Codex 就行：

（先从本页下载 3 个 csv 放到桌面：crm_export.csv、calendar_bookings.csv、website_form.csv）桌面上有 3 个来源的销售线索导出文件，列名各不一样：CRM 的邮箱列叫 Email，预约工具叫 attendee_email，官网表单叫 work_email。请帮我： 1) 把这 3 个文件汇总，按邮箱（统一小写）去重，同一人多来源时合并字段； 2) 按 4 个维度各 25 分给每条打分：行业匹配(spa/美容/零售高分)、公司规模(11-200 最佳)、沟通信号、意向词； 3) 算总分并打标签：≥70 Hot、40-69 Warm、<40 Cold； 4) 按总分从高到低排序，单独列出给销售优先跟进的 Hot 名单。

📊 3 个来源文件预览（注意邮箱列名各不相同 —— 这正是要练「按邮箱去重」的原因）：

文件	来源	条数	邮箱列名	公司列名
crm_export.csv	CRM 沉淀	20	Email	Company Name
calendar_bookings.csv	预约工具	9	attendee_email	company
website_form.csv	官网表单	21	work_email	organization

📎 本节文件（点下载，放到桌面再喂给 Codex）

📊 crm_export.csv — 来源①CRM · 20 条（邮箱列 Email）
📅 calendar_bookings.csv — 来源②预约工具 · 9 条（邮箱列 attendee_email）
🌐 website_form.csv — 来源③官网表单 · 21 条（邮箱列 work_email）
📊 day09_leads.csv — 合并后对照答案（50 条，做完可比对）
📋 ICP与评分规则.md — ICP+评分模型
💬 Codex提示词模板.md — 线索评分提示词

数据均为合成脱敏（邮箱统一 @example.com），围绕虚构品牌 Auratē，可放心演示。

销售线索评分+ CRM 集成

今天结束，你能做到

为什么"线索散在一堆工具里"是销售第一杀手

海外运营常见的 3 类线索来源

Lead Scoring 模型 · 4 × 25 = 100 分

今天的核心 Prompt（一字不差喂给 Codex）

为什么 Prompt 长成这样？拆 6 个动作

3 档线索 · 不同动作

销售当天联系

nurturing 序列

季度 review

完整数据流 · 从原始线索到销售桌面

每周线索质量周报（Markdown）

Lead Scoring · 4 个常见误区

学员练习50 条脱敏线索跑通

练习步骤 · 跟着做

常见报错 · 3 类

进阶 · 一句话切换 CRM /

把工具部署成定时任务

合规 · 4 件你不能不管

今日成果 · 4 项验收清单

今天 3 个 takeaway

📦 本节素材 + 对 Codex 说的话

讲师备注 · 按 N 切换显示 / 隐藏

销售线索评分
+ CRM 集成

学员练习
50 条脱敏线索跑通