近日,第33届ACM国际多媒体会议在爱尔兰都柏林举行,智象未来团队成功摘得最佳演示奖,成为中国首个获此殊荣的多模态生成式人工智能初创企业团队,彰显了智象未来在多模态生成式AI领域的顶尖科研实力和卓越创新能力。
ACM国际多媒体会议由国际计算机学会主办,是全球多媒体领域最具权威性与影响力的学术盛会之一。每年会议评选的最佳演示奖,具有极高含金量和行业认可度,代表着评审委员会和与会学者对该技术创新性、实用性、成熟度和现场展示效果的最高肯定。
智象未来获奖的"灵感智能体"统一多模态智能体,以革命性技术将复杂的视觉内容创作,转化为直观的对话体验。其核心优势在于突破碎片化多模态技术工具的局限,在单一界面内无缝整合了文本生成图像、指令式图像编辑及文本/图像生成视频功能,有效解决了跨模态语义对齐的行业难题。该技术基于170亿参数量的HiDream-I1模型,依托稀疏扩散Transformer(DiT)结构与动态混合专家(MoE)设计,在HPS、GenEval等国际权威基准测试中表现优异。而针对指令式图像编辑任务,团队通过上下文视觉条件优化HiDream-I1模型,使其能够实现精准的图像修改效果。
该智能体开创了可及性、交互式视觉叙事和多模态生成AI中协作内容创作的新方式,通过将生成和编辑融合于一个对话驱动的体验中,降低了高质量视觉内容创作的门槛,并显著缩短了迭代周期,实现从想法到优质产出的 "一次会话" 创意循环。目前,这一技术原型已成功迭代应用于智象未来旗舰产品vivago.ai的对话生成功能中,为用户提供更自然、个性化的多模态对话交互体验。
此外,在本次ACM国际多媒体会议上,智象未来举办了Identity-Preserving Video Generation挑战赛。赛事吸引了北大、上海交大、腾讯等国内外顶尖科研及企业团队参加。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
奉节脐橙香飘古都 产业振兴谱写新篇——2025奉
初冬的西安,渭水凝霜,古城含翠。一场以“橙”为媒的农业盛事,在丝...
广交会搭台、生产线接棒,中顺洁柔以“一张好纸”诠
在全球贸易格局持续演进的背景下,第138届中国进出口商品交易会(...
智邦粉面浇头供应链:携手抢占千亿赛道,诚招全国区
2025年粉面市场规模已突破1500亿元,年增速高达15%,千亿...
同安区人武部:以“武装工作日”为抓手 奏响国防建
近日,同安区人武部创新采用“多点联动、全域赋能”模式开展9月份“...
中微公司发布首款晶圆边缘刻蚀设备Primo Ha
在SEMICONChina2025展会期间,中微半导体设备(上海...
抢抓机遇捷报频,金哚哚平台又一区域代理落定江苏省
近日,金哚哚平台宣布,其江苏省区域代理合作项目成功落地。平台成都...