中国软件开源创新大赛系列培训课第一讲:计图AI算法挑战赛

2022/05/17 Tutorial

中国软件开源创新大赛系列培训课第一讲:计图AI算法挑战赛

计图挑战赛正在如火如荼地进行当中,从4月15号开放报名至今,已经有超过1700名选手报名参赛,为了提高参赛选手参赛体验,促进比赛良性竞争,比赛组委会将在2022年5月18日晚上8点,开展计图挑战赛教学课程,课程的内容介绍如下。

一、软件开源大赛介绍
报告人:陈渝,清华大学,第五届中国软件开源创新大赛组委会主席
报告内容:为激发开源创新活力,培养开源软件人才,助力开源生态建设,探索开源教育改革,在教育部高等学校计算机类专业教学指导委员会和软件工程专业教学指导委员会的推动和支持下,在国家自然科学基金委员会信息科学部的指导下,由中国计算机学会(CCF)主办的第五届“中国软件开源创新大赛”正式启动。
二、计图人工智能挑战赛介绍
报告人:张松海,清华大学,计图AI挑战赛组委会委员
报告内容:计图 (Jittor) 人工智能算法挑战赛是在国家自然科学基金委信息科学部指导下,由北京信息科学与技术国家研究中心和清华大学-腾讯互联网创新技术联合实验室于 2021 年创办、基于清华大学Jittor深度学习框架的人工智能算法大赛。今年,该赛事将同时作为中国软件开源创新大赛中开源任务挑战赛的赛事之一,开展 AI 算法竞赛。
大赛面向所有在校学生和 AI 相关领域从业人士开放,旨在通过竞赛的方式提升人们对数据分析与处理算法的研究与应用能力,推动我国自主人工智能平台的生态建设和人工智能应用的不断深入;大赛奖励丰厚,包括28万奖金在内的现金奖励,还有SCI期刊论文发表机会、名校教授的推荐信、企业实习的绿色通道等奖励。

三、计图入门及热身赛的赛题解析

报告人:梁盾,清华大学,计图AI挑战赛组委会委员
报告内容:热身赛赛题是手写数字生成,这是计图挑战赛的第一个关卡,本赛道将在数字图片数据集MNIST 上训练Conditional GAN(generative adversarial nets)模型,通过输入一个随机向量z 和额外的辅助信息y (如类别标签),生成特定数字的图像。本报告将带大家通关计图热身赛,同时针对热身赛,手把手带大家入门计图的基础使用,报告内容包含:计图的安装与测试、计图基础变量类型、计图文档与社区交流等等。
1  手写数字MNIST数据集示例
四、赛道一解析风景画生成
报告人:周文洋,清华Jittor团队核心成员
报告内容:图像生成任务一直以来都是十分具有应用场景的计算机视觉任务,从语义分割图生成有意义、高质量的图片仍然存在诸多挑战,如保证生成图片的真实性、清晰程度、多样性、美观性等。清华大学计算机系图形学实验室从Flickr官网收集了1万两千张高清(宽1024、高768)的风景图片,并制作了它们的语义分割图。其中,1万对图片被用来训练。本赛道会提供1000张测试分割图片,参赛选手需要根据测试图片生成符合标签含义的风景图片。本次报告将会介绍赛题内容、讲解baseline模型以及使用方法,同时对评分标准进行解释和分析。
图2 风景画生成赛题的数据集展示
五、赛道二解析:可微渲染新视角生成
报告人:辛杭高,清华Jittor团队核心成员
报告内容:可微渲染是联系二维图形与三维场景的桥梁,近年来已经在计算机视觉、计算机图形学领域引发研究新热潮。本赛道希望基于可微渲染,通过训练集中场景图片及对应相机参数,对场景的三维信息进行学习,最终达到生成新视角图片的目的。我们的比赛数据集包含5个不同的场景,每个场景有100-300张图片用于训练,20-60张图片用于验证和测试。数据集场景包含透明材质、金属材质、布料等复杂材质,我们期望通过提升场景在材质、几何、光照上的复杂度,让我们的比赛更有区分度,也更加有趣。在本次报告中,我们将对赛题内容、baseline的使用方法进行教学解析,也会对赛题内容进行理论分析,帮助选手在比赛中取得好成绩。

图3 可微渲染的场景示例

六、计图开源:JNeRF带你5秒训练好NeRF

报告人:杨国炜,清华Jittor团队核心成员

报告内容:NeRF受到关注以来许多工作从不同角度研究了对NeRF的改进。随着NeRF效率的提升,深度学习框架逐渐成为NeRF效率提升的瓶颈,许多工作修改、添加cuda代码以提升效率,这进一步带来了代码编写的混乱、项目工程冗杂等问题。NeRF需要一个统一、高效、框架高度适配的模型库,建立统一流程,提升科研效率。JNeRF模型库分析了现有的NeRF方法,将NeRF的主要训练流程总结为几个部分,不同部分之间相互解耦,使其能够方便地调用和替换。
我们基于Jittor框架复现了Nvidia在今年一月公开的Instant NGP,并发布能5秒训出NeRF的JNeRF库,这是迄今为止最快的NeRF训练工作。JNeRF利用了Jittor高效、即时编译、模块化的特性,成功复现了Instant NGP,并在精度和速度上和原版实现几乎一致,同时对代码进行细粒度的模块化,方便研究人员通过Python进行二次开发。目前Jittor是复现Instant NGP速度和精度最高、且支持Python语言的深度学习框架,希望这能给广大科研人员带来便利。

图4  JNeRF的架构图
欢迎大家积极参与计图AI挑战赛的培训课程!

BiliBili直播链接为:

https://live.bilibili.com/22558868

5月18日晚上课程的安排为:

欢迎大家积极报名参赛

比赛报名网址为:
https://www.educoder.net/competitions/index/Jittor-3
选手可以在计图讨论社区的挑战赛专栏参与讨论:
https://discuss.jittor.org/c/competion/7
赛事交流QQ群:1018591346,请填写“战队名称+真实姓名”提交入群申请。
计图开发者交流群:76122083
比赛社区交流二维码:
GGC往期回顾
1. 计图开源:马里兰大学乔怿凌等在TVCG发文,提出三维模型内蕴对称性的检测方法
2. 平面四边形网格自支撑曲面的构造 | CVMJ Spotlight
3. 计图开源:高林团队CVPR发文, 提出基于NeRF的场景风格化方法
4. 计图开源:清华刘玉身团队发表PAMI论文,提出点云补全网络PMP-Net++
5. 第二届“计图”人工智能算法挑战赛启动

您可通过下方二维码,关注清华大学计算机系图形学实验室,了解计算机图形学、Jittor框架、CVMJ期刊及会议的相关资讯。

 

Search

    Table of Contents