pm视角vibe coding开发app
工具开发prompt
我现在想要开发一个批量扒取b站视频的应用,作为一个github的开源项目来帮助观众学习。
我想要三个功能:
- 输入具体的单个b站的视频,获得字幕;
- 想要扒取整个b站合集列表的视频,获得一个字幕列表,最终可以选择所需要的字幕进行下载/全选;
- 想要扒取某个up主的个人空间的全部视频,获得一个字幕列表,最终可以选择所需要的字幕进行下载/全选。
扒取字幕的时候大概率会遇到两种情况:
- b站本身有编辑好的字幕/ai字幕,直接扒取即可,优先级是编辑过的字幕>平台ai生成的字幕
- 此视频无字幕,则需要用某种语音转文字的文件,来对视频的音频进行扒取,我的思路是,先下载mp4视频文件,然后是提取出mp3音频文件,最后将mp3音频文件转化为字幕。
对于字幕文件,我想给用户提供三种选择,前两种是srt/ass,带有时间码,最后一种是txt文件 不带时间码——适合用ai模型进行总结。
以上是我全部的工程目标,我们开始?
进度
带人工/平台生成字幕的单个视频的抓取已经开发完成(支持json-所谓ai训练的素材;srt-作为把平台ai生成字幕校正为人工字幕的基底;txt-个人化长视频学习+耀琨ai视频总结,ds淘宝-api)。
目前正在集成Asrtool的无字幕视频的快速从音频转译成为字幕的feat。
耀琨视频录制
- 给耀琨txt文件,让他演示一遍工作流;
- 分p上传 - github/gitlab下载;拿到txt之后用ai处理;tips
小贴士:
- 从根到茎叶,先看大框架,再跟着回溯推演具体的填充物/内容;
- 定期复习 - 费曼学习法进行默写,第一阶段:确保自己能默写出1-1到4-4;第二阶段:练习1-1-1到4-4-4的默写和推演(分为四组:1-1-1到1-4-4;2-1-1到2-4-4;3-1-1到3-4-4;4-1-1到4-4-4);第三阶段:学完1-1下面的十六组默写一次,由此一直推演到4-4(共十六组)。总体上,16个为一组进行复习,从根到茎叶的顺序;
- 利用ai工具学习旁系分支,结合当时及后续的实践视频理解主义主义萌发的背景
- 一次只学一个视频/五个视频,利用好b站记笔记的功能;1-3级的账号,一天学习一个即可;4级以上的可以一天学五个,边学边发布笔记(也可以教一下怎么使用这个记笔记的功能);切记不要多学,多学会反噬,坚持才是你唯一要做的事-踮脚尖,感觉有能力冲刺可以冲刺一下,低谷期维持最低空飞行,但是不要坠落;形成世界观的阶段,一定要悬置一切,正常生活,和想要完全陷入的欲望拉开距离,反复练习和拉伸欲望,形成角质,这样最后构筑起的思想根基才足够牢固,现实行动才因而坚定且有力。