登录
主页
 文章
Vidnami 是一款功能强大的在线视频创作平台,前身为 Content Samurai,于 2015 年推出,2020 年更名为 Vidnami。它运用人工智能技术,能够分析输入的文本,自动从大量素材中选取合适的图像和视频片段,将文字快速转化为具有专业外观的视频,无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库,包括 3000 万张图片和 3 万首音乐,还支持自动配音,用户可以录制或上传音轨,也可选择自动语音风格。Vidnami 适合营销人员、博主、网红等希望快速创建高质量视频以提升内容影响力、增加曝光度和吸引更多受众的人群,可用于制作销售视频、内容视频、网红视频、培训课程视频、广告视频等多种类型的视频。
1142
8
7
Animaker以动画制作为主的文字转视频软件。创建新项目导入文字后,可根据文字内容挑选合适模板和素材,软件自动结合生成初步视频,再利用编辑功能如剪辑、加特效、调颜色等进行优化。最初以提供基础的文字转动画功能和一些简单的模板为主,随着技术的不断进步和用户需求的增加,逐渐丰富了其功能和素材库,不断优化算法以提高生成动画的质量和效率,界面也变得更加友好和易用,在全球范围内获得了越来越多用户的认可,尤其在自媒体创作者、教育工作者以及小型企业等群体中受到欢迎。
900
1
1
Avidemux是一款遵循GPL协议的开源视频编辑软件,最初由开发者“mean”于2001年编写。它最初只是一个简单的工具,用于从AVI文件中提取音频,并且仅支持Linux系统。随着时间的推移,Avidemux逐渐发展成为功能更全面的视频编辑软件,增加了对多种视频格式的支持、非线性编辑功能、视频滤镜以及编码转换等功能。如今,Avidemux不仅支持Linux,还推出了Windows和macOS版本,使其能够在更多平台上使用。
541
9
9
Synthesia允许用户通过输入脚本生成视频,支持 AI 配音和数字形象,适合教育和商业用途,例如制作教学视频、产品介绍视频等。通常没有严格的长度限制,但生成较长视频可能需要更多处理时间。官方网站: https://www.synthesia.ioSynthesia于2017年由三位爱沙尼亚人创立,早期专注于开发基于人工智能技术的文本转视频解决方案,致力于将文字脚本转化为生动的视频内容。团队不断打磨技术,探索市场需求,努力提升产品的质量和性能。
801
3
8
OpenShot跨平台支持Linux、Mac和Windows;可快速修剪视频,有强大的动画框架,能对内容进行淡入、滑动等动画操作;有视频效果引擎,可移除背景、调整亮度等;支持将音频可视化为波形,还能渲染3D动画标题和效果。2008年8月,OpenShot由Jonathan Thomas启动开发,最初目标是为用户提供稳定、免费且易用的视频编辑器,当时仅面向Linux系统。2016年发布的2.1.0版本开始支持Windows、macOS系统,大大扩展了用户群体。
754
5
6
Scira:是由 Zaid Mukaddam 开发的一个简约的 AI 驱动的搜索引擎,由 Vercel AI SDK 提供支持,可使用 Grok 2.0 等模型帮助用户在互联网上查找信息。Scira的前身是MiniPerplx。随着大模型AI技术的发展,传统搜索引擎难以满足人们的需求,Scira应运而生,旨在提供全新的搜索体验。它由Vercel AI SDK提供支持,并可使用Grok 2.0等模型进行搜索。其代码开源在GitHub上,开发者社区活跃,不断对其进行更新维护,推动着Scira的功能完善和发展。
956
3
9
VideoGPT是基于GPT架构的视频生成工具,支持从文本生成视频。最初,研究人员尝试将自然语言处理中的GPT架构思想引入视频处理领域,开始探索如何利用其强大的语言理解和生成能力来处理视频的时空信息。 模型改进与创新:如VideoGPT+模型结合了先进的图像编码器和视频编码器,克服了传统方法在处理视频时的局限,在捕捉丰富空间细节和理解复杂时间动态上展现出卓越性能。iVideoGPT采用新颖的压缩tokenization技术,可有效离散高维视觉观察,能在数百万人类和机器人操作轨迹上进行预训练,建立起多功能基础。
1184
2
6
Runway ML是一个创意工具集,支持文本生成视频等多种功能,适合艺术创作和多媒体项目。Runway ML创立于2018年,总部位于纽约,是一家专注于图像和视频编辑领域的人工智能公司,其发展备受瞩目,2023年4月入选《福布斯2023年AI 50榜单:最有前途的人工智能公司》,同年6月获得谷歌1亿美元的D轮投资,估值达15亿美元 。它为创作者们打造了功能强大的创意工具集,将人工智能技术深度融入其中 。在功能方面,提供了丰富多样的选择,涵盖文本转视频、图像转视频、视频转视频、文本转图像、图像转图像等。文本转视频功能可依文本提示生成逼真视频,拓展视频制作边界;图像转视频能赋予静态图像动态生命力;视频转视频方便对现有视频编辑、增强或风格化;文本转图像助创作者将抽象想法化为视觉图像;图像转图像可编辑、改变图像外观风格 。此外,运动画笔工具能创建逼真运动效果,Gen2模型带来更高质量和逼真结果,物理引擎可模拟现实物理定律用于动画制作,还支持多用户实时协作,让团队创作更高效 。
701
9
13
OpenManus 是一个开源的多智能体协作平台,旨在实现与 Manus 类似的功能,并支持本地部署。其底层架构基于多种大型语言模型(LLM),中间层通过多智能体协作机制将任务分解为可执行的子任务,执行层则调用各类 API 接口完成具体操作。OpenManus 无缝集成了包括 Claude 3.5 和 Qwen VL Plus 在内的多个顶级大模型。
993
7
12
LosslessCut 是一款基于 FFmpeg 的图形界面视频剪辑工具,其核心优势在于无损剪辑技术。通过关键帧剪切,无需重新编码,从而实现高速剪辑并保持原始视频质量。该工具支持提取音频流和字幕流,并可添加配乐和字幕轨道。LosslessCut 支持几乎所有的常见音视频格式,包括 MP4、MOV 和 MKV 等,并且跨平台兼容 Windows、macOS 和 Linux。
963
9
8
Kdenlive支持GNU/Linux、Windows和BSD等操作系统;有多轨视频编辑功能,可同时处理多条音视频轨道;几乎支持所有FFmpeg支持的音频和视频格式及编解码器;可设置不同工作区,界面和快捷键可配置,能创建2D标题,应用特效和过渡效果,支持代理编辑和自动备份。适合专业视频编辑师和有一定经验的视频制作人员。
612
3
7
OmniParser是一款开源工具,可通过解析用户界面截图生成结构化数据,助力打造视觉驱动的 GUI 自动化代理,赋能跨平台交互。项目地址:https://github.com/microsoft/OmniParser一、技术原理1.数据集构建:从流行网页和应用中提取数据,构建可交互图标检测数据集和图标描述数据集,为模型训练提供基础。
508
0
5
Shotcut跨平台支持Windows、Mac、Linux和Android;支持4K、8K视频处理,可进行帧精确搜索和视频合成,有丰富的滤镜和特效;音频编辑功能强大,配备示波器和多种滤波器,支持淡入淡出等过渡效果;无需导入即可直接在时间线上编辑,支持HTTP、HLS等多种网络流协议。Shotcut 以其易用性、丰富的功能、广泛的格式支持以及可定制的工作流,成为自媒体新手入门和普通用户进行日常视频编辑的理想选择,同时也能满足一些对视频编辑有一定要求,但又不想使用过于复杂专业软件的用户的需求。
982
8
2
Awesome DeepSeek Integrations是DeepSeek 生态的开源集成宝库,汇集了与 DeepSeek AI 模型(如 DeepSeek-V3、R1、Coder 等)无缝集成的工具和应用,覆盖代码助手、翻译、知识管理等多种场景,支持多语言和多种开发平台。作为一站式集成资源库,是连接开发者、研究人员以及企业与 DeepSeek 生态系统的桥梁,降低了AI 技术开发门槛,加速 AI 在各领域的落地应用。
550
2
13
Open-Chat-Video-Editor结合了ChatGPT技术,用户只需与AI对话,告知想要的视频内容,AI即可自动生成成片,能自动识别需求,生成搞笑、情感、商业宣传等不同类型的视频。适合想要高效、快速出片,不想在剪辑上花费太多时间,更注重视频创意的人群。项目地址:https://github.com/scutlihaoyu/open-chat-video-editor
967
2
5
chatbox是一个AI客户端应用和智能助手,支持GPT、Claude、Gemini等众多先进的AI模型和API,可在多种平台上使用。支持 Windows、Mac 和 Linux 操作系统,号称是桌面端的终极 AI 助手。不过,对于大多数用户,官方推荐使用闭源的 Chatbox 官方版,它完全免费、安装简单且支持更多最新功能。
718
9
10
multi-agent-orchestrator是一个灵活且强大的框架,用于管理和协调多个AI智能体,处理复杂的对话,支持智能意图分类、双语言支持等功能。项目地址:https://github.com/awslabs/multi-agent-orchestrator一、基本功能 1. 多智能体协调与调度Multi - agent - orchestrator 能够对多个智能体进行有效的协调和调度。它可以根据任务的需求和各个智能体的能力、状态,合理分配任务给不同的智能体。例如,在一个物流配送场景中,框架可以根据各个配送智能体(如无人机、配送车)的位置、负载情况和行驶速度,将不同的订单分配给最合适的智能体进行配送。
921
8
4
PDFMathTranslate基于AI技术的PDF文档处理工具,能完整保留排版并进行双语翻译,支持Google、DeepL等主流翻译服务,还提供了CLI、GUI和Docker的支持。一、功能数学公式精准识别:借助先进的 OCR(光学字符识别)技术,PDFMathTranslate 能够精准地识别 PDF 文档中的数学公式。无论是复杂的微积分公式,还是线性代数中的矩阵表达式,它都能准确无误地提取出来,为后续的翻译和处理奠定基础。这一功能对于数学、物理、工程等领域的学术文献和专业资料处理至关重要,解决了传统 OCR 技术在识别复杂数学符号和结构时容易出现的错误和遗漏问题。
670
9
12
eliza是一个强大的多智能体模拟框架,使用TypeScript构建,可用于创建、部署和管理自主AI智能体,能让智能体跨多个平台互动并保持一致的个性和知识。项目地址:https://elizaos.github.io/eliza一、基本功能1.多平台部署与交互:可在Discord、Twitter、Telegram等多个平台构建和部署具有一致个性的自主AI智能体,支持语音、文本和媒体交互,能适应不同社交平台的交流形式,满足用户多样化的沟通需求。
895
5
3
Langflow是一个面向开发者的低代码工具网站,专注于多智能体人工智能、提示工程和检索增强生成(RAG)应用的开发,能帮助开发者轻松构建强大的AI智能体和工作流。以可视化方式搭建AI应用,通过拖放操作就能创建复杂的AI工作流,降低开发门槛,减少编写样板代码的工作量,让开发者把更多精力放在创新上。提供数百种预构建的流和组件,涵盖多种数据来源、模型和向量存储选项,包括OpenAI、HuggingFace等常见模型,以及Notion、Google Drive等数据源。若现有组件无法满足需求,还支持自定义组件开发。适用于提示工程、智能体构建和RAG应用开发。如能创建帮助开发者调试代码的聊天机器人,以及从大量文档中检索特定信息的RAG驱动聊天机器人。
897
5
12
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号