Lazy loaded image
用AI克隆顶级博主的大脑,打造你的专属AI顾问
字数 2776阅读时长 7 分钟
2026-1-20
2026-1-20
type
Post
status
Published
date
Jan 20, 2026
summary
slug
tags
推荐
人工智能
计算机
学习
category
知行合一
icon
password
notion image

  1. 需要准备的:yt-dlp、平台cookie、python脚本
  1. 修改python脚本中的参数:作者页面,cookie文件名
  1. notion翻译润色(notion mpc、notion ai)
 

 
欢迎来到这份终极指南。 本笔记为你提供一个完整的、可操作的、全自动化的工作流,将任何一位顶尖知识博主的思想体系,转化为您个人的、可交互的AI顾问和私有知识库。
我们的宗旨是:克隆他的大脑,继承他的智慧,吞噬他的思想。
本工作流遵循三大原则:
  1. 全程自动化:尽可能减少手动操作,实现批量处理。
  1. 工具免费化:核心工具均为开源免费。
  1. 流程简单化:无需深厚的编程背景,普通学习者也能上手。

工作流总览

本工作流分为三个核心步骤:
  1. 【知识获取】:批量抓取博主所有视频的原始字幕文件。
  1. 【知识精炼】:通过本地AI大模型,将原始字幕自动化处理为高质量的Markdown知识文档。
  1. 【知识内化与创造】:使用NotebookLM和Obsidian等工具,打造AI分身并融入个人知识体系,最终实现价值创造。

第一步:知识获取

目标:全自动、批量化地获取目标博主所有视频的原始字幕文件(.srt或.vtt格式)。

核心工具箱

工具
类型
优点
缺点
推荐用户
TarTube
图形化界面 (GUI)
操作直观,无需命令行
稳定性稍弱,批量处理大量视频时可能卡顿
新手、不熟悉命令行的用户
yt-dlp
命令行 (CLI)
极致灵活、速度快、稳定可靠
需要使用终端,有一定学习门槛
进阶用户、追求极致效率和自动化的用户

关键前置步骤:获取Cookie文件

为什么要Cookie?
Cookie文件相当于您登录视频网站的“数字身份证”。在批量下载时携带Cookie,可以向服务器证明您是真实用户,从而避免被反爬虫机制拦截,这是确保任务成功的关键。
  1. 安装浏览器插件:在您的浏览器(Chrome/Edge/Firefox)中,搜索并安装插件 Get cookies.txt LOCALLY
  1. 登录网站:确保您已在该浏览器中登录了目标视频网站(如YouTube)。
  1. 导出Cookie:点击浏览器右上角的插件图标,然后点击Export按钮,浏览器将自动下载一个名为cookies.txt的文件。
  1. 妥善保管:将这个cookies.txt文件保存在您即将进行操作的工作文件夹中。

方案A:使用 TarTube (图形化界面)

  1. 下载与安装
      • 前往TarTube的GitHub官方页面。
      • 在页面右侧找到并点击 Releases
      • 根据您的操作系统(Windows/macOS)下载对应的安装包(推荐选择带ffmpeg的版本),并像安装普通软件一样完成安装。
  1. 初始化设置
      • 首次打开时,按提示选择一个用于存放下载文件的默认文件夹。
      • 根据引导完成yt-dlp核心组件的安装。
  1. 配置Cookie
      • 在TarTube主界面,点击左上角的 编辑 -> 全局下载选项
      • 在弹出的窗口中,切换到 文件 -> cookies
      • 勾选“使用Cookie文件”,并点击浏览按钮,选择您之前导出的cookies.txt文件。
  1. 下载字幕
      • 回到主页面,点击顶部第二个按钮 添加新频道,粘贴目标博主的频道URL。
      • 在左侧频道列表中,右键点击新添加的频道,选择 检查频道,等待软件获取所有视频列表。
      • 再次进入 编辑 -> 全局下载选项,在 名称 选项卡的输入框中,粘贴以下参数。这会告诉TarTube只下载中英文字幕,并跳过视频本身:
        • codeCode
      • 切换到 字幕 选项卡,勾选 下载所有可用的字幕文件
      • 点击确认保存设置。
      • 在右侧视频列表中,分批次(建议一次5-10个)选中视频,右键点击 下载

方案B:使用 yt-dlp (命令行)

  1. 环境搭建
      • 安装Python:前往Python官网 (python.org) 下载并安装最新稳定版。在安装过程中,务必勾选 Add Python to PATH 选项。
      • 安装yt-dlp:打开终端(Windows下为CMD或PowerShell,macOS下为Terminal),输入以下命令并回车:
        • codeBash
      • (可选)保持更新:为确保最佳兼容性,可以随时运行以下命令升级yt-dlp:
        • codeBash
  1. 核心命令
      • 第一步:获取所有视频链接(侦察)
        • 在一个新建的空文件夹中,打开终端,运行以下命令,它会快速抓取频道内所有视频的URL并存入一个文本文件:
          codeBash
          注意:请将 YOUTUBE_CHANNEL_URL 替换为真实的频道链接。
      • 第二步:批量下载所有字幕(总攻)
        • 确保cookies.txt和上一步生成的video_links.txt都在当前文件夹中。然后运行以下“终极指令”:
          codeBash
          参数解析:
          • -cookies cookies.txt: 使用Cookie文件进行认证。
          • -write-auto-sub: 下载自动生成的字幕。
          • -sub-lang en: 指定下载英文字幕。
          • -skip-download: 跳过视频和音频的下载,只取字幕。
          • -batch-file video_links.txt: 从指定文件中读取链接列表并批量处理。

第二步:知识精炼

目标:利用本地AI大模型,将第一步获取的原始字幕文件,自动化地翻译、润色,并处理成干净的Markdown格式知识文档。

核心工具:LM Studio + Python脚本

优势:数据完全私有,无API调用费用,可深度定制处理逻辑。
  1. 部署本地大模型 (LM Studio)
      • 前往LM Studio官网 (lmstudio.ai) 下载并安装软件。
      • 打开软件,点击左侧的放大镜图标进入搜索页。
      • 搜索推荐模型,例如 qwen3-8b-instruct-GGUF,选择一个版本点击下载。
      • 下载完成后,点击左侧第三个“本地服务器”图标。
      • 在顶部选择刚刚下载的模型,服务器设置保持默认即可。
      • 点击 Start Server 启动本地API服务器。
      • 关键设置:点击右侧的Settings,确保 CORS (Cross-Origin Resource Sharing) 选项是开启的,这样我们的Python脚本才能访问它。
      • 性能配置:在Load选项卡下的Context Length中,根据你电脑的显存进行设置(例如8G显存可设置为8000)。
  1. 运行自动化脚本
      • 准备脚本:获取我们提供的Python脚本文件。
      • 配置脚本:用任何文本编辑器打开脚本,修改开头的三个参数:
          1. input_folder: 设置为第一步存放原始字幕文件的文件夹路径。
          1. output_folder: 设置为你希望保存Markdown文档的目标文件夹路径。
          1. api_url: 保持默认的http://localhost:1234/v1/chat/completions即可,除非你修改了LM Studio的默认端口。
      • 执行脚本:在存放脚本的文件夹中打开终端,运行以下命令:
        • codeBash
          注意:请将 your_script_name.py 替换为真实的脚本文件名。
      脚本将自动开始处理,你可以看到终端中会打印出每个文件的处理进度。

第三步:知识内化与价值创造

目标:将精炼后的知识文档转化为可交互的AI顾问和个人知识体系的一部分,并探索其价值变现的可能。

核心工具:Obsidian + NotebookLM

1. Obsidian:构建你的知识网络

  • 用途:作为知识的最终沉淀地和“第二大脑”。
  • 操作:将第二步生成的所有Markdown文档导入到你的Obsidian仓库中。
  • 价值
    • 深度学习:利用Obsidian强大的双向链接功能,将博主的知识点与你已有的知识体系进行关联,形成知识网络。
    • 本地AI对话:通过Copilot等AI插件,连接到我们之前部署的本地LM Studio模型,直接在Obsidian内与你的笔记进行对话。

2. NotebookLM:召唤你的AI私人顾问

  • 用途:打造一个只基于博主知识回答问题的、绝对忠诚的AI分身。
  • 操作
      1. 打开Google NotebookLM官网。
      1. 创建一个新的“空间”(Space),例如命名为“Dan Koe AI顾问”。
      1. 点击 添加来源 (Add Source),将第二步生成的整个Markdown文件夹上传上去。
      1. 等待AI完成索引和消化。
  • 核心功能与价值
    • 引用溯源:所有回答都会标注原文出处,彻底杜绝AI幻觉。
    • 全局洞察:可以跨越上百个文档进行宏观问题的分析、比较和总结。
    • 自动学习工具:一键生成研读指南FAQ思维导图等,加速学习进程。
    • 语音摘要 (Audio Overview):将知识库内容生成类似播客的语音摘要,实现通勤路上的“听学”。

价值延伸:从学习到创造

拥有了这套高质量的知识库后,其价值远不止于学习:
  • 二次创作:可作为你自媒体频道的“无限选题库”和素材来源。
  • 价值变现:可深度加工成精读笔记、思维导图、付费专栏等虚拟产品进行售卖。

备选方案:Notion MCP + Notion AI

如果你的主力工具是Notion,第二步和第三步可以被完美整合:
  1. 使用 Notion MCP 插件,通过与AI对话的方式,批量清理、处理并导入第一步的字幕文件到Notion数据库。
  1. 利用 Notion AI 的“AI属性”功能,自动对英文原文进行翻译和润色。
  1. 直接在Notion内,使用其强大的数据库和AI问答功能,实现知识管理和AI顾问的雙重目标。

恭喜你! 至此,你已经完整掌握了这套“克隆顶级大脑”的终极工作流。现在,就开始选择你的第一个目标,开启全新的认知升级之旅吧!
上一篇
Python程序开发管理那些事(基于UV)
下一篇
Miniconda和Anaconda 对比