第五届“马栏山杯”国际音视频算法大赛颁奖典礼现场。
红网时刻新闻9月30日讯(记者 胡弋)以AI工作流打造汉代云纹服饰、使用AI技术逆向识别AIGC生成图像、用小样本量提升垂类大模型表现……9月29日,第五届“马栏山杯”国际音视频算法大赛颁奖典礼在长沙举行,现场演示了AI技术在多个领域的创新应用与互动体验。
本届大赛着眼于产学研贯通,共吸引超过2万支队伍参赛。算法赛三大赛题全部入选CCF-A类国际顶尖会议。其中,“大模型逻辑推理”赛题、“基于多样性的跨域推荐”赛题入选IJCAI 2024,“AIGC生成图像判定”赛题入选ACM MM 2024。今年大赛还特别举办了专注于文博领域AIGC二创的创新应用赛,以数字创作为抓手,用科技推动文化遗产保护传承。
以科技力量弘扬湖湘文化 AIGC创新赛助力数字文博发展
今年8月,芒果数智旗下数字文博大平台“山海”APP正式上线。在今年的算法大赛中,创新应用赛道聚焦于AIGC赋能文博主题,鼓励参赛选手用AI的力量促活湖湘文化。
该赛题共计811支队伍参与,该赛道冠军麻若璇、胡扬扬以《马王堆刺绣云纹AIGC自动生成系统》,成功训练了布料纹理和服装款式的生成模型,其AI工作流生成的服装不仅完美保留了汉代云纹的优美,还创新性地设计出符合现代审美的服装款式。另一位人气选手马世杰则对大禾人面纹方鼎的人面特征进行延展,与最近红遍全球的《黑神话悟空》融合,创作出了极具趣味性的青铜人面作品。
在科技越来越深入介入文化生产的今天,创新应用赛道正成为芒果将数字文博、湖湘文化与科技创新有机结合又一次实践。
三大赛题入选国际顶尖学术会议 前沿技术加速解决应用问题
将技术进步真正融入内容生产,是五年来算法大赛始终坚持的出题方向。此次大赛也通过大模型逻辑推理、基于多样性的跨域推荐、AIGC生成图像判定三个赛题,积极探寻技术落地的实用价值。
“大模型逻辑推理”这一赛题技术与近年来业界最热门的大模型相关,旨在提升小参数量大模型在垂类领域的推理水平,以较小的样本量与成本跑出甚至超越大参数量大模型的效果。围绕传媒及文娱产业,垂类应用“芒果大模型”,有效应用于剧本生产、高清制播、后期制作等方面,并成为广电行业首批通过备案的大模型,目前已在各业务场景中落地应用。
“基于多样性的跨域推荐赛题”则是一道音视频推荐领域的经典升级赛题,旨在探索提升推荐系统多样性和跨域学习能力的方法,从而提升流媒体平台的内容推荐质量。这一赛道的竞争也格外激烈,冠军队伍三名队员在全球最大的数据科学社区一共获得过24枚金牌,最终方案在准确性和多样性相比赛题基线提升了67%,成功夺冠。
而“AIGC生成图像判定”赛题则源于AI生成图片在互联网广泛传播可能引发的安全问题,旨在探索如何准确识别AI生成的图片,以技术破题,判断眼见是否为实。该赛道冠军方案构造了新数据以增强模型能力,并针对不同大小的图片采取了差异化的处理策略,对伪造图像的识别能力较强,并且具备较好的计算效率和通用性。
因算“湘”聚芒果 五年之期成果丰硕剑指未来
大赛今年首次设立“音视频领域关键技术突破奖”,旨在网络视听、动漫、文博等关键领域鼓励原创性与引领性技术研发。此前,湖南广电在与湖南大学的合作中已在三维视觉等领域取得了一系列成果,并应用于数字文博大平台“山海”所聚焦的文物数字化修复等场景。
数据显示,五届算法大赛参赛人数已超过50000人,参赛选手来自中国、澳大利亚、日本、沙特阿拉伯、新加坡、英国、美国等国家,影响力日益扩大。五年间,数十位选手因算法大赛而入职湖南广电,成为算法领域快速发展的中坚力量。
来源:红网
作者:胡弋
编辑:施文
本文为娱乐频道原创文章,转载请附上原文出处链接和本声明。