简单介绍一下作者从视频生成文章的思路，还是有些可以学习借鉴的地方，主要是能生成插图和从视频中提取代码。1. 输入YouTube视频地址后，下载视频2. 基于视频需要分别处理文本和视频帧2.1 音频处理成文本2.1.1 使用Whisper从音频获取带有时间戳的文本2.1.2 将文本合并2.2 视频帧处理2.2.1…

发布时间: 2024-03-03 13:50:35

1分

数据加载中

简单介绍一下作者从视频生成文章的思路，还是有些可以学习借鉴的地方，主要是能生成插图和从视频中提取代码。
1. 输入YouTube视频地址后，下载视频
2. 基于视频需要分别处理文本和视频帧
2.1 音频处理成文本
2.1.1 使用Whisper从音频获取带有时间戳的文本
2.1.2 将文本合并
2.2 视频帧处理
2.2.1…
IT技术
( twitter.com )

简单介绍一下作者从视频生成文章的思路，还是有些可以学习借鉴的地方，主要是能生成插图和从视频中提取代码。

1. 输入YouTube视频地址后，下载视频

2. 基于视频需要分别处理文本和视频帧

2.1 音频处理成文本
2.1.1 使用Whisper从音频获取带有时间戳的文本
2.1.2 将文本合并

2.2 视频帧处理
2.2.1 对视频抽帧并上传到服务器获取到可以访问的图片URL（GPT-4V需要用到）
2.2.2 对视频帧的图片提取信息（借助GPT-4V）
2.2.3 根据提取的图片信息决定是否使用该图片到正文，或者要使用截图中的文本信息（例如代码块）

3. 根据时间戳信息将图片的信息、文本和插图混合在一起

4. 生成带有Markdown的文章信息（需要长上下文的GPT-4）

5. 生成目录（不需要LLM，很多现成代码可以从Markdown生成目录）

最终成品可以看：https://t.co/BvzEJtqRwJ

图片并茂效果还是挺不错的，另外很多人肯定关心2小时的视频生成这么一篇文章成本多少？

答案是$4-6美元，比我预想的便宜一点，因为如果抽帧比较频繁的话应该要花费不少。

另外生成这么长的文章，估计要用到32K的GPT-4。

作者没有开源，但是根据上面的流程自己实现一个也不复杂，关键还是抽帧和从视频帧提取信息那部分需要做好平衡。

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

🔗

该 Reddit 文章介绍了作者使用 GPT-4 API 创建了一个 Python 脚本，可以自动化制作 YouTube Shorts 视频，从语音到编辑，甚至到选择插图图片。…
IT技术
( twitter.com)

1年前 • AI 托我给您带个话 • -- 点击 0 评论

一个有意思的DIY项目，可以录制动作的低成本机械手。YouTube博主Mr Innovative在他的视频中分享了制作过程。并在视频简介中给出了PCB板设计文件、电路图、arduino代码和材料清单，动手能力强的朋友可以尝试一下。…
推特中文圈
( twitter.com)

1年前 • sundyme • -- 点击 0 评论

用 AI 辅助听播客、看视频。

昨天介绍了怎么用 ChatGPT，从 281 期播客里生成中文播客语料库，今天介绍一个播客相关的实用 AI 工具 Audio2Doc。

我用 T…
推特中文圈
( twitter.com)

1年前 • 倪爽 • -- 点击 0 评论

StreamingT2V一个可以生成超过 2 分钟长视频（1200 帧）的项目。
而且还会开源，开原生态的长视频生成有救了？
项目介绍：…
IT技术
( twitter.com)

8个月前 • 歸藏 • -- 点击 0 评论

一篇超级精彩的关于怎样构建一个通用的AI web 爬虫的文章：
文章写的特别好，从思路到几种解决方案，到调优，到最终的结果分析，是我最近看到的干货满满的文章，也怪不得原贴已经有 1K+ 的 likes。
简单说一下我理解的思路：
使用的工具：
*…
IT技术
( timconnors.co)

11个月前 • Viking • -- 点击 0 评论

IT技术

🔗

该 Reddit 文章介绍了作者使用 GPT-4 API 创建了一个 Python 脚本，可以自动化制作 YouTube Shorts 视频，从语音到编辑，甚至到选择插图图片。…
IT技术
( twitter.com)

IT技术

推特中文圈

用 AI 辅助听播客、看视频。

昨天介绍了怎么用 ChatGPT，从 281 期播客里生成中文播客语料库，今天介绍一个播客相关的实用 AI 工具 Audio2Doc。

我用 T…
推特中文圈
( twitter.com)

推特中文圈

StreamingT2V一个可以生成超过 2 分钟长视频（1200 帧）的项目。
而且还会开源，开原生态的长视频生成有救了？
项目介绍：…
IT技术
( twitter.com)

IT技术

IT技术

对两个下沉市场的顶流短视频网红，秀才（男）和一笑倾城（女），这个视频做了简短的介绍。
时政
( twitter.com)

时政

ChatGPT刚刚取代了视频创作者！

只需一个提示，就可以使用ChatGPT创建视频。

以下是如何在3个简单步骤中生成视频：

[🔖稍后阅读]
IT技术
( twitter.com)

IT技术

🔗

这篇 Reddit 文章介绍了作者个人使用的 AI 工具，包括 Plus AI for Google Slides、My AskAI、…
IT技术
( twitter.com)

IT技术

这个视频的制作方法公布了
作者发布了如何使用IP-Adapter进行图像和视频生成的全面指南。
文章提供了各种节点和设置的详细解释
并分享了这个视频的WORKFLOWS
作者：
教程及下载：
IT技术
( civitai.com)

IT技术

IT技术

🔗 该 Reddit 文章介绍了作者使用 GPT-4 API 创建了一个 Python 脚本，可以自动化制作 YouTube Shorts 视频，从语音到编辑，甚至到选择插图图片。… IT技术 ( twitter.com)

IT技术

推特中文圈

用 AI 辅助听播客、看视频。 昨天介绍了怎么用 ChatGPT，从 281 期播客里生成中文播客语料库，今天介绍一个播客相关的实用 AI 工具 Audio2Doc。 我用 T… 推特中文圈 ( twitter.com)

推特中文圈

StreamingT2V一个可以生成超过 2 分钟长视频（1200 帧）的项目。 而且还会开源，开原生态的长视频生成有救了？ 项目介绍：… IT技术 ( twitter.com)

IT技术

IT技术

对两个下沉市场的顶流短视频网红，秀才（男）和一笑倾城（女），这个视频做了简短的介绍。 时政 ( twitter.com)

时政

ChatGPT刚刚取代了视频创作者！ 只需一个提示，就可以使用ChatGPT创建视频。 以下是如何在3个简单步骤中生成视频： [🔖稍后阅读] IT技术 ( twitter.com)

IT技术

🔗 这篇 Reddit 文章介绍了作者个人使用的 AI 工具，包括 Plus AI for Google Slides、My AskAI、… IT技术 ( twitter.com)

IT技术

这个视频的制作方法公布了 作者发布了如何使用IP-Adapter进行图像和视频生成的全面指南。 文章提供了各种节点和设置的详细解释 并分享了这个视频的WORKFLOWS 作者： 教程及下载： IT技术 ( civitai.com)

IT技术

创建一个新帐户

登录

🔗

该 Reddit 文章介绍了作者使用 GPT-4 API 创建了一个 Python 脚本，可以自动化制作 YouTube Shorts 视频，从语音到编辑，甚至到选择插图图片。…
IT技术
( twitter.com)

用 AI 辅助听播客、看视频。

昨天介绍了怎么用 ChatGPT，从 281 期播客里生成中文播客语料库，今天介绍一个播客相关的实用 AI 工具 Audio2Doc。

我用 T…
推特中文圈
( twitter.com)

StreamingT2V一个可以生成超过 2 分钟长视频（1200 帧）的项目。
而且还会开源，开原生态的长视频生成有救了？
项目介绍：…
IT技术
( twitter.com)

对两个下沉市场的顶流短视频网红，秀才（男）和一笑倾城（女），这个视频做了简短的介绍。
时政
( twitter.com)

ChatGPT刚刚取代了视频创作者！

只需一个提示，就可以使用ChatGPT创建视频。

以下是如何在3个简单步骤中生成视频：

[🔖稍后阅读]
IT技术
( twitter.com)

🔗

这篇 Reddit 文章介绍了作者个人使用的 AI 工具，包括 Plus AI for Google Slides、My AskAI、…
IT技术
( twitter.com)

这个视频的制作方法公布了
作者发布了如何使用IP-Adapter进行图像和视频生成的全面指南。
文章提供了各种节点和设置的详细解释
并分享了这个视频的WORKFLOWS
作者：
教程及下载：
IT技术
( civitai.com)