登录
主页
 文章
PaintsUNDO工具能够模拟真人将目标画作拆解成一步步绘画过程。由 AI 绘图圈大神、ControlNet 作者张吕敏(lvminzhang)开发。用户只需上传一张图片,就能让 AI 根据图片分解成相应步骤,然后录制成绘画过程视频,对于想要学习绘画过程或制作绘画教程的人来说非常有用。PaintsUndo 是一个创新的人工智能项目,它专注于模拟和理解人类在数字绘画中的绘图行为。该项目的愿景是开发出能够精确反映人类艺术家需求和行为的 AI 模型,以促进人工智能与人类艺术家之间更紧密、更自然的合作。
1095
4
9
Fooocus是一款学习了 Stable Diffusion 的离线、开源和免费特点,以及 Midjourney 不需要用户进行参数调整优势的图像生成软件。采用 GPL v3 许可证,对硬件配置要求相对较低,只需要 4G 显存即可使用,旨在提供高质量的文本到图像的转换,同时简化用户的操作流程。2023 年 8 月 9 日首次发布。由斯坦福大学博士生张吕敏(lv min zhang)开发,他也是 ControlNet 论文的作者。
674
0
4
Duke Humanoid是一个完全开源的双足机器人平台,由杜克通用机器人实验室推出。该平台创新性地利用了被动动力学设计,使得机器人能够高效地移动,并且能耗降低。Duke Humanoid为开发者提供了双足机器人的硬件设计和相关的控制算法,方便开发者进行双足机器人的研究和开发。主要用于双足机器人的运动控制、步态规划、平衡控制等方面的研究。
1145
0
10
Amundsen是一个开源的数据发现和元数据管理工具,主要用于提高企业数据的可见性、可访问性和可理解性。Amundsen由Lyft公司开发,并于2019年开源。其开发的初衷是为了解决企业内部数据分散、难以查找和理解的问题。随着越来越多的企业开始关注数据治理和数据资产的有效管理,Amundsen逐渐受到广泛关注,并吸引了众多开发者的参与,不断发展壮大。
938
5
11
Marquez由Willy Lul Ciuc和Julien Le Dem在WeWork于2017年开发,并在2019年开源,目前是LF AI & Data基金会的孵化阶段项目。具有用户友好且直观的界面,操作细节设计出色,方便用户快速上手和使用。代码简洁,部署相对容易,降低了使用门槛和部署成本。依靠底层的OpenLineage协议,具有较好的结构,能够与其他遵循该协议的工具和系统进行良好的交互和集成。
719
2
2
MMCV是一个基于 PyTorch 的图像/视频处理和转换器,支持 Linux、Windows 和 macOS 等系统,是计算机视觉研究人员最常用的包之一,支持 Python 和 C++开发语言。提供了许多图像和视频处理的工具和函数,能够方便地进行数据加载、预处理、模型训练和评估等操作。它还集成了一些常见的计算机视觉算法和模型,方便用户直接使用和修改。
958
5
11
Stanford ALOHA是一个低成本、敏捷的机器人平台,整个系统是开源的,包括硬件设计、用于 3D 打印的 CAD 模型、模拟器和培训代码。ALOHA即“a lowcost opensource hardware system for bimanual teleoperation”,是一个用于双手远程操作的低成本开源硬件系统,可用于双手远程操作机器人执行精细、动态以及接触式丰富的任务。
1082
6
13
MyMediaLite 是一个 C 编写的推荐系统库,提供了多种推荐算法的实现,包括协同过滤、基于内容的推荐、矩阵分解等。它可以用于构建各种类型的推荐系统,并且支持在线学习和增量更新。 MyMediaLite 由德国希尔德斯海姆大学的研究人员开发,其开发部分受到了欧洲委员会第七框架计划项目“动态个性化多媒体(MyMedia)”的资助。
1127
2
7
OnePanel是一个生产规模、Kubernetes 原生的视觉 AI 平台,具有用于模型构建、自动标记、数据处理和模型训练管道的完全集成的组件。它提供了一个端到端的解决方案,方便用户进行机器视觉项目的开发和部署。OnePanel基于 Kubernetes 的架构使其具有良好的可扩展性和可管理性,能够方便地在云环境或本地集群中运行,并且支持多用户协作和资源管理,适合企业级的机器视觉项目。
1005
7
10
Wireshark是开源的网络协议分析工具,可用于捕获和分析网络数据包,帮助用户了解网络通信的情况,排查网络故障和安全问题。Wireshark最初由Gerald Combs在1997年底开始研发,最初名为Ethereal。在1998年7月释出其第一个版本v0.2.0,之后不断发展并吸引了众多开发者参与。由于商标问题,在2006年5月更名为Wireshark。2008年发布了1.0版本,2015年发布了2.0版本并更新了用户界面,其功能不断完善和增强。2022年,Sysdig成为Wireshark的主要赞助商,并在2023年成立了Wireshark基金会。
756
3
8
KnowledgeTree提供文档管理、协作和知识共享功能。用户可以上传、组织和搜索文档,设置访问权限,还可以对文档进行版本控制和审批流程管理,适用于企业内部的知识管理和文档协作。一、主要功能 文档管理:提供集中式的文档存储库,企业可以将各种类型的文档,如合同、提案、营销计划等统一存储和管理,降低了文件丢失或错放的风险。
938
6
2
YOLO是最快的计算机视觉工具之一,由 Joseph Redmon 和 Ali Farhadi 于 2016 年开发,专门用于实时图像对象检测。它使用神经网络将图像划分为网格,然后同时预测每个网格,以提高识别效率。目前已经发布到 YOLOv8 版本,是一款前沿、最先进(SOTA)的模型,在各种对象检测与跟踪、实例分割、图像分类和姿态估计任务中表现出色。
614
5
2
Diffusers Image Outpaint是一个专注于图像扩图的开源工具。它可以根据图像内容生成外部区域,使图像看起来更加自然和完整。操作方便,没有太多复杂的功能设置,非常适合新手,并且可以在本地离线运行。一、特点和功能1. 工作原理: 基于人工智能算法:利用深度学习中的扩散模型,对输入的图像进行分析和理解。扩散模型会学习图像的特征、纹理、颜色等信息,然后根据这些信息生成新的像素,以扩展图像的边界。
583
8
14
KKSwarm是一个开源的机器人集群研究平台,适用于多车编队、集群算法的验证与开发,以及强化学习的研究。该平台采用蜂窝六边形结构的设计,配备了视觉定位摄像头、路由器、运算 PC 等配件。KKSwarm为研究人员提供了一个高效、易用的集群研究环境,支持多种机器人的协同工作和虚拟环境中的强化学习进化。目标是为研究人员搭建一个高效、易用的集群研究平台。其项目名称致敬了 Kevin Kelly(未来三部曲作者)的机器社会进化论,该项目以开源的组织架构推进,体现了“去中心化、分布式、科技演化符合生物演化”等理念。
760
9
6
Droidlet由 Facebook 开源的机器人开发平台,利用自然语言处理和计算机视觉技术来构建机器人,使其能够理解周围的世界。Droidlet 提供了一系列的工具和组件,方便开发者测试不同的计算机视觉和自然语言处理模型。Droidlet强调模块性和可扩展性,开发者可以根据自己的需求选择不同的模块进行组合和扩展。该平台还提供了一个仪表板,方便开发者进行调试和可视化操作。
1128
4
4
TurtleBot是基于 ROS 的移动机器人平台,它建立在 iRobot 与 OpenRobotics 密切合作的 Create 系列移动底盘之上。TurtleBot 集成了多种传感器(如激光雷达、摄像头等)和计算设备(如树莓派等),为开发者提供了一个完整的机器人开发和学习环境。具有成本低、易于使用和功能强大等特点,适合初学者入门和进行机器人相关的学习和研究。TurtleBot 提供了丰富的示例代码和教程,帮助开发者快速上手。
869
9
13
OpenMV是一个致力于降低入门难度的开源低成本机器视觉平台,采用易学的 Python 语言编程,其硬件基于 STM32 系列 ARM CortexM DSP 处理器和 OmniVision 传感器。具备人脸检测、特征点描述符、色彩追踪等基本功能,还支持 QR 码和条形码解码、AprilTag 识别以及动态图像录制等高级应用。并且自带的 RPC(远程 Python/程序调用)库,方便与其他设备进行通讯,具有很强的扩展性和灵活性,适用于教育、工业自动化、智能家居等多个领域。
1090
1
2
AuraFlow由生成媒体公司 Falai 发布的开源图像生成器。经过大量训练,能够生成文本到图像的内容。它在不同的艺术风格和场景下都有较好的表现,并且遵循标准的 Apache 2.0 许可证,吸引了很多开发者的关注。不过,它对 GPU 的性能要求较高,需要大约 12GB 的显存才能运行其 FP16 版本。适合对图像质量和风格有较高要求的用户,可用于艺术创作、概念设计等方面。
842
5
2
PaddleOCR由百度的飞桨团队开发。是一个功能强大的开源光学字符识别工具,支持多种语言的文本识别,能够准确识别图像中的文字,并将其转换成可编辑的文本格式。它在文档扫描、车牌识别、票据识别等场景中有广泛的应用,具有较高的识别准确率和较快的识别速度。并且提供了丰富的文档和教程,方便开发者使用和二次开发。
910
0
4
Stable Diffusion是目前非常知名且应用广泛的图像生成开源项目,具有变革性的开源人工智能图像生成模型。它能够根据用户输入的文本描述生成高质量、高分辨率的图像,具有很强的创造性和灵活性。用户可以通过调整各种参数,如采样步数、学习率、提示词权重等,来控制生成图像的风格和内容。
691
8
6
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号