GitHub
Hugging Face
项目
出版物
GitHub
Hugging Face
项目
出版物
推动多模态生成式人工智能创新
GitHub
Hugging Face
研究小组
Architectural insights
探索新一代人工智能系统所需的新型神经网络架构与优化方法。
Multimodality
构建能够跨多种模态理解并生成数据的模型。
Robotics
通过嵌入式智能系统将人工智能感知与物理动作连接起来。
Generative Design
将生成式算法应用于各行业的复杂设计挑战。
Controllable GenAI
构建可精确控制内容、风格和属性的生成模型。
Video GenAI
用于高质量视频生成与时序建模的突破性技术。
项目
RoboBenchmart
用于评估机器人在暗仓环境中物体操作质量的机器人基准测试
SPARTA
一种用于评估推理分割鲁棒性的方法
T-LoRA
框架...
NoReGeo
用于评估 LLM 与 VLM 模型内在几何理解能力的基准
Feature Analysis
视觉编码器研究
GigaEvo
一种利用大语言模型(LLM)通过迭代变异与选择自动改进程序的算法
LLM Microscope
关于标点符号在 Transformer 上下文记忆中隐藏作用的研究
Sonar-LLM
一种以句子向量表示思考并以 token 生成输出的自回归 Transformer
InnerControl
一种在扩散全过程中保持空间一致性的训练策略
MaterialFusion
高质量材质迁移框架,允许用户调节材质施加程度,在新材质属性与原对象特性之间取得最佳平衡
OmniFusion
基于预训练 LLM 与视觉模态适配器的多模态模型
Kandinsky
用于文本到图像生成的扩散模型
出版物
T-LoRA: Single Image Diffusion Model Customization Without Overfitting
Научные публикации
•
17.02.2026