图像与视频生成技术,作为现代科技领域的一大亮点,正逐渐改变着我们的视觉体验。6月3日,公司内部邀请华中科技大学博士生导师,中国图象图形学会理事桑农教授于绵阳校区学术报告厅开展了以“图像与视频生成揭秘”为主题的讲座。本次讲座由学校党委副书记、副校长袁勋主持。
桑农讲座现场
讲座中,桑农阐明了本次讲座会以“生成式AI概述”“图像生成图像”“文本生成图像”以及“视频生成”四个部分进行讲解。在第一部分中,从人类艺术创作与计算机AI技术的关系进入主题,提出了“计算机能否取代人类进行艺术创作?”的问题,他认为计算机AI技术有很大希望取代人类进行艺术创作,对接下来详细介绍图像的生成过程奠定基础。
天府学子认真听讲
在“图像生成图像”部分中,桑农重进行了详细的讲解,同时提出了两种其自我总结的图像生成方式——自我生成方式和对抗生成方式。随后,他以通俗易懂的话语以及更简介明了的流程图方式给学子们介绍了图像的自我生成的第一个基本构架——编码器生成图片的运作原理,其实质上是对加噪后的图像进行编码,又经过一种code模式后解码生成。在桑农讲解流程的过程中也点明了其受潜在空间分布不聚集影响的缺点。其后,又简要说明第二个基本构架,也就是从AE到VAE的直观转换过程的理解,实质上是使解码的噪声具有鲁棒性。随后,又将对抗式生成方式中的以循环生成对抗网络为代表的几个基本构架及其存在的缺点等进行了简单的概述。通过了解原理,可以更加明白图像生成图像的技术在图像翻译领域中的广泛应用。
讲座过程中,桑农还对“文本生成图像”以及“视频生成图像”进行了阐述。他用流程图解释了文本生成的模型架构由文本编码器、生成模型、解码器组成,其中特别需要注意文本与图像对齐。文字与图像生成图像的讲解后,教授又解释视频生成图像是由前两种共同控制而形成,进而对前面的内容进行小结。
论坛结束之际,桑农提到,图像生成技术正处于快速发展的阶段,它所带来的创新和变革是前所未有的,通过今天的讲座,也仅仅触及了其潜力的表面。他鼓励大家继续关注这一领域的最新进展,将理论转化为现实中的应用,也鼓励天府学子能够将自己所学的理论知识应用到实践层面,真正做到知行结合。袁勋在发言中也表示,希望作为新一代青年的天府学子们能够运用想象力、创意和批判性思维在未来继续突破图像生成技术的界限,赋予图像新的生命。
团委宣传部:张宁
摄影:沈雨豪
初审:吕碧莲
复审:李定峰
终审:车学文
2024年6月5日