Bot简介
这是一款会通过AI大模型从《甄嬛传》全部台词中查找台词的bot。 主要提供两个功能:相关台词和相似台词
相关台词
类似问答的形式,可以作为用户输入的下文或者答案。带有一定趣味性。 例如:用户输入:我的女友很能作 相关台词:贱人就是矫情【34集36分07秒】
相似台词
就是查找和用户输入尽可能相似的台词。 例如:用户输入:情同姐妹 相似台词:情同姐妹 毕竟也不是亲姐妹【37集25分18秒】
Bot构思
经常看到一些短视频中用经典电视剧(亮剑,甄嬛传等)和电影桥段作为问题的回答。这种视频还是很有吸引力和有特色的。我就在思考他们是如何能在制作的时候想到这些片段的。感觉除了对桥段的高度熟悉也别无他法。但是人的记忆力终究有限,也无法更广度的覆盖(虽然很多时候,只使用经典桥段就够了,但是谁不想挖掘下新的桥段更合适的桥段呢)。
LLM可以很好的理解中文(字幕),可以提供比起精准匹配更合理的搜索能力,中文字幕又携带时间戳方便定位。而知识库又可以方便存储大量数据。让AI作为智能的桥段索引应该很合适。万事俱备,动手开发。
技术实现原理
开发相对容易些,就不细说了。
- 先找到全剧字幕文件,本来想找《亮剑》的,但是没找到。最近陪老婆看《甄嬛传》就选了它。
- 数据预处理。python随便写写就行。把集数加到时间数据中。时间数据保留到秒。
- 创建知识库
- 创建工作流调用知识库。获取的字幕是逐行存储的。你需要先借助LLM将多行字幕整合成完整的台词,整合时间戳。再从台词中进行挑选。另外可以用选择器处理,没有匹配台词的情况。
- 在开发bot调用工作流即可。
后续使用场景&商业化场景分析
从功能来讲,该Bot主要作为短视频开发者的素材查找工具。短视频开发群体的体量还是很大的。
- 方便查找台词从而定位视频位置。
- 为短视频制作者提供创意,就是让台词试着回答你的各种问题。如果有意思就可以采纳。例如:我的领导蠢,怎么办? 台词:她一向巧言令色 专与本宫作对【30集02分48秒】。短视频制作者从现在的既要想问题又要(有限的桥段中受限选择)想答案。变为随便想个有趣的问题,看看有没有答案。 门槛更多低了,生产力也就提升了。
- 方便横向扩展,《亮剑》《复仇者联盟》《肖申克的救赎》等等都可以快速横向复制。
- 后续计划开发插件,可以基于时间戳直接定位到视频并播放。现在已有插件无法直接定位播放时间,也可能有版权问题。
botID:7352789254961266727
评论记录:
回复评论: