【证券时报网】当虹科技发布多模态视听大模型BlackEye
发布时间:2024-05-24
来源:证券时报网
责任编辑:任丽珺
据当虹科技消息,在4月27日下午召开的“2024中关村论坛·超高清视听科技创新发展论坛”上,当虹科技(股票代码:688039)与北京经济技术开发区联合发布BlackEye大模型基座及应用场景。
BlackEye融合了多种深度神经网络组件,包括Transformer、Diffusion等组件,通过文本、图像、视音频、三维模型等多种模态的编码、解码、多模态潜空间对齐、多模态语言推理及生成等技术,实现不同模态信息之间的推理和预测生成。
BlackEye深度整合了视频、音频、图像、文本和三维模型等跨模态内容的推理与生成能力,包括文本生成、文生视频、图生视频等生成式算法,以及AI视觉增强、AI横竖转换、AI智能集锦等编辑式算法。这些技术的融合应用,可为视听传媒、空间计算、工业视觉和智能座舱等行业提供完整的创新解决方案。
会上还首发了依托BlackEye多模态视听大模型生成的AI视频短片《BlackEye:让每一个视听的想象都成为现实》,凭借卓越的画面连贯性、优异的画质及立体震撼的三维声效,赢得了在场观众的高度赞誉。
据了解,中关村论坛是国家级科技创新交流合作平台,汇聚了全球科技与产业界的创新共识,其成果发布环节备受瞩目。此次论坛期间,国家广电总局副局长朱咏雷、北京市委副书记刘伟,以及来自国家广电总局、中央广播电视总台、北京市委宣传部的领导和专家,共同见证了BlackEye多模态视听大模型发布。