作者:伍杏玲

人工智能作为新一轮科技革命和产业变革的新赛场,正助力改革我们的生活。为鼓励各行业的开发者基于昇腾 AI共同打造软硬件解决方案,探索前沿模型算法,加速 AI 与行业融合创新,构建具有活力的 AI 开发者生态,由全国20多个昇腾人工智能生态创新中心与华为、联合新一代人工智能产业技术创新战略联盟、OpenI启智社区、中国人工智能产业发展联盟共同举办的首届昇腾 AI 创新大赛,于 4 月 30 日正式启动,开发者们积极参与其中,各展所长。

本大赛共 16 个赛区、两大赛道,应用赛道是面向行业场景进行应用创新,昇思赛道是基于昇思进行算法和前沿任务创新,多元赛道充分为 AI 开发者搭建创意舞台。

11月16日,2022昇腾AI创新大赛总决赛举办,来自全国16个赛区的32支入围队伍在现场及线上展开比拼,经历激烈的角逐,应用赛道角逐出5个金奖10个银奖17个铜奖,昇思赛道评比出20个金奖15个银奖10个铜奖。

此次比赛中涌现出许多优秀作品,让笔者印象深刻的是一支由三位博士生组成的学霸团队“NLPCC不能去现场”,在昇思赛道一鼓作气复现了五道量子计算论文赛题,最终取得银奖的好成绩。

 学霸博士生队伍,攻克五道量子计算赛题

这支博士生团队各有所长,分工明确。队长白琪,浙江大学博士研究生,计算数学专业,研究方向为机器学习、量子计算;同学倪天昊则是研究无监督聚类,偏微分方程谱理论与偏微分方程数值解;队员白瑞娜,贵州大学TCCI实验室博士生,软件工程专业,主攻方向为多视图无监督学习。

白琪

倪天昊

白瑞娜

白琪率先参赛,由于他的研究方向是量子计算,对 MindQuantum 创新任务中与量子计算相关的五个赛题跃跃欲试,最终和团队成功复现量子卷积神经网络、量子生成对抗模型,以及贫瘠高原现象的缓解,实现Multi-Basis Encoding的变分量子算法与MetaQAOA算法求解Max-Cut 问题。

白琪表示,当前量子计算机的发展正处于NISQ(含噪中型量子)阶段,量子比特数目较少,且计算过程中含有噪声。为了更好的利用量子计算的优势,并克服含噪声的缺点,许多研究者将量子计算与机器学习结合起来。当前变分量子算法(VQA)很有前景,它可以结合量子计算与经典计算的优势,来处理各种问题。在MindQuantum案例教程中也有各类变分量子算法的简介。

在采访的过程中,笔者猜想为什么本次大赛特设量子计算前沿赛题?

我们知道,人工智能的发展离不开算据、算法、算力三大要素,随着数字化转型步伐加快,产生的数据体量呈爆发式增长,算法模型日益复杂,参数量呈指数级增加,智能设备已应用到各行各业,算力无处不在。传统计算机的算力瓶颈已成为制约人工智能发展的关键因素。而量子计算以量子比特为基本单元,通过量子态的受控演化实现数据的存储计算,具有经典计算无法比拟的巨大信息携带和超强并行处理能力。量子计算可依靠强大的算力将使人工智能的学习能力大大提高,这将有助于提升模型训练的速度。

昇思 MindSpore 早有布局量子计算,其涵盖的量子计算框架MindQuantum,支持多种量子神经网络的训练和推理,可高效处理量子机器学习、量子化学模拟和量子优化等问题,为科研人员、老师和学生提供了快速设计和验证量子机器学习算法的高效平台。

在本次大赛中,白琪团队在昇思 MindSpore、MindQuantum的 支持下,解题过程勇于尝试,顺利通过创新挑战。

直面挑战,勇闯难关

在比赛过程中,可能会遇到各种挑战,从白琪的叙述中笔者看到他对技术孜孜不倦的追求与深入探索。

白琪从自己最熟悉的量子卷积神经网络开始着手第一个赛题:用量子卷积神经网络求解量子多体问题。当把数据集下载下来后,他发现该数据集的样本个数较少,于是他用线性插值的方法把数据做增强,从原来 81 个数据点增加到 961 个,相当于每两个点的间插入 11 个点来增大样本。此时再稍微调一下参,准确率可达百分之百,数据增强后的平均准确率可达 99%,远远超过题目要求的 90%。白琪也是较早一批提交解题的选手。

第二个赛题是实现量子生成对抗模型 QGAN,论文中生成器采样数据使用的是光量子计算,白琪团队基于 MindQuantum 编程时,由于架构不一样,在通过大量阅读资料后,白琪团队大胆地采用量子比特计算替代光量子计算,最后完成 QGAN 模型的实现。

第三个赛题是实现 Multi-Basis Encoding 的变分量子算法来解决 Max-Cut问题。白琪表示,之前并没有完整地实现过QAOA(量子近似优化算法),做题时先了解和学习 QAOA 理论,再根据论文公式往下研究。就这样,边学变实验,顺利复现。

第四个赛题是用元学习解决组合优化问题,实现 MetaQAOA 算法。在这道题里,量子神经网络(quantum neural network,以下简称QNN)和经典 LSTM 网络结合起来了,相当于让 LSTM 生成QNN参数,再训练 LSTM 如何生成参数,即训练了一个求解器来求解模型里的参数,这里面涉及到 LSTM 和量子模拟器的结合。白琪认为 LSTM 与QNN的耦合是一个难点,论文里将前一步迭代的QNN参数,QNN输出以及隐藏态三项输入到 LSTM 里,得出 LSTM 输出,再输入到量子网络里。然而在实现时遇到一些问题,白琪团队在多次尝试后,将原来的QNN参数给舍弃,直接把 QAOA 里的参数当作 LSTM 的输入和输出。QAOA线路参数呈层级,而 LSTM是用来处理序列数据,LSTM的序列输入与QAOA线路参数的层级有很好的对应关系,因此团队根据QAOA的参数形状设置LSTM的输入与输出。这是与论文实践不同的创意点。值得一提的是,得益于 MindSpore 的良好兼容性,基于 MindQuantum 的量子机器学习层可以无缝与 MindSpore 中的算子衔接,团队最终顺利将 LSTM  以及量子层耦合到模型里。

第五个赛题是贫瘠高原现象的缓解,使用迁移学习实现。在做实验时,白琪团队遇到一些问题可能复现不了。后来仔细分析结果图,从中找蛛丝马迹来调整模型。可能是论文写的较隐晦,白琪他们一开始阅读时没有完全理解。在提交第一次代码后,发现只复现出来了一部分,后来团队又重新读论文,细心寻找线索,最后添加到代码实现中,实现模型。

从白琪身上我们看到,成功从来不是一蹴而就,而是日积月累的沉淀,踏踏实实的努力,细心、耐心、专心,缺一不可。

以赛促学,培养创新人才

经历几个月的紧张比赛,白琪表示在比赛中,收获和成长良多。针对本次大赛和使用到的框架昇思 MindSpore 有以下几点切身体会:

虽然本次大赛他只完成量子计算的五道赛题,但从大赛整体来看,赛题涵盖范围面广泛,从经典神经网络,到量子计算,再到蛋白质结构预测等科学计算多个领域。在解题过程中,难免遇到问题挑战,此时大赛专家及时提供帮忙。例如白琪在复现论文时,由于原文是在 TensorFlow Quantum 上实现的,使用 MindQuantum 实现过程中发现这两个框架的一些算子定义存在全局相位差异,由于当时对量子计算理解不够深刻,开始时按照 TensorFlow Quantum 里的算子直接把全局相位加上去,导致代码无法运行。随后咨询大赛专家徐旭升博士和查找资料后,最终将问题解决。

白琪在使用昇思 MindSpore 框架来完成赛题时,发现其用户体验友好,中文文档易于理解。他建议第一次接触MindSpore的开发者多看文档、多写代码、多尝试,找到适合自己写的方法。

此外,他认为 MindQuantum 的数据输入方式友好,且涵盖众多损失函数,在研究量子计算问题时,开发者只需一键运行这些函数非常方便。昇思MindSpore AI计算框架 使量子计算的学习门槛降低,让研究者可以只关注于算法的设计而不是代码实现。另外,MindQuantum 支持学术关联,优化了一些学术复现过的模型、经典算法等,方便查找和使用。

以赛促学,白琪通过对赛题论文的研究,还拓展阅读了大量相关论文,这个过程学到量子计算在实际应用的过程,了解 QAOA、QGAN 等模型。自身编程能力也有不少提高,例如之前做的是简单模型模拟,通过比赛学习 LSTM 耦合过程,未来如果要实现大模型模拟的话,了解到可通过结合经典神经网络、量子神经网络、量子机器学习层来实现,相信实现会更加轻松。

在采访过程中,白琪给笔者的印象即是乔布斯在斯坦福大学演讲时曾说的名言“求知若饥,虚心若愚”。笔者从侧面感受到2022昇腾 AI 创新大赛以赛促学,产教结合的方式,有效推动 AI 人才培养,让众多像白琪一样的参赛选手借助大赛来提高算法技艺,迸发创新思想。登录官网获取更多2022昇腾AI创新大赛信息: 昇腾社区-官网丨昇腾万里 让智能无所不及

Logo

20年前,《新程序员》创刊时,我们的心愿是全面关注程序员成长,中国将拥有新一代世界级的程序员。20年后的今天,我们有了新的使命:助力中国IT技术人成长,成就一亿技术人!

更多推荐