MOSS-TTSD 是一个口语对话语音生成模型,实现了中英双语的高表现力对话语音生成,支持零样本多说话人音色克隆,声音事件控制以及长语音生成。 它能够根据输入的多说话人对话文本,直接生成高质量的...<
混元 3D 世界模型 1.0(HunyunWorld-1.0)是首个开源并且兼容传统 CG 管线的可漫游世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。 HunyunWor...<
LangExtract 是从非结构化文本提取结构化信息的开源 Python 库,该库使用 LLMs 根据用户定义的指令从非结构化文本文档中提取结构化信息(诸如临床笔记或报告之类的材料),识别并整...<
Google Sans Code 是谷歌发布的开源等宽编程字体,为代码带来清晰度、可读性以及一丝谷歌独特的品牌特色。 主要特性 增强可读性:专为代码编辑器和终端中的最佳可读性而设计 支持脚本:扩...<
Step3 是阶跃星辰开源的最新一代基础大模型,该模型采用专家混合(MoE)架构,总参数量为 321B,激活参数量为 38B,旨在为企业和开发者提供性能与成本极致均衡的推理方案。 Step3 模...<
雾象是一款由大型语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。 将雾象部署在本地后,只需输入词语,点击生成,便可得到动画。 项目团队设...<
Sourcebot 是一个自托管工具,可以帮助你回答有关代码的问题。 代码搜索:搜索并浏览所有存储库和分支,无论它们托管在何处 询问 Sourcebot:询问有关你的代码库的问题,并让 Sour...<
MCP-Use 是一种开源方式,可将任何 LLM 连接到任何 MCP 服务器并构建具有工具访问权限的自定义 MCP 代理,而无需使用闭源或应用程序客户端。 主要特点: 开源 将任何 LLM 连接...<
KubeForge 是一款可视化优先的工具包,可简化构建、验证和管理 Kubernetes 部署配置的流程。无论你是 Kubernetes 新手还是维护大型系统,KubeForge 都能通过直观...<
Wren AI 是你的 GenBI 代理,你可以使用自然语言查询任何数据库 → 在几秒钟内获得准确的 SQL(文本到 SQL)、图表(文本到图表)和 AI 生成的见解。 Wren AI 的开源语...<