《Journal of Machine Learning》机器学习领域一本世界级高水平科学期刊终于问世啦!

2022-04-18
来源:

编者按

《Journal of Machine Learning》机器学习领域一本世界级高水平科学期刊终于问世啦!该期刊由北京大学国际机器学习研究中心和北京大数据研究院孵化出的北京科学智能研究院赞助,鄂维南院士担任期刊主编。


简介

《Journal of Machine Learning》(JML,https://www.global-sci.org/jml)是机器学习领域一本全新的期刊,由全球科学出版社(Global Science Press)出版,北京大学国际机器学习研究中心和北京科学智能研究院赞助,鄂维南院士担任期刊主编(Managing Editors: 韩劼群,Arnulf Jentzen,李千骁,王磊,许志钦,张林峰)。JML发表机器学习所有相关领域的高质量研究论文,包括机器学习的创新算法、机器学习理论、机器学习在人工智能、自然科学、社会科学和工程中的重要应用等。JML对理论文章和应用文章同等重视,是一本以电子形式出版的季刊。

以下是第一期四篇文章的中文介绍,英文原文可以在杂志官方网页中阅读(https://www.global-sci.org/jml)。


一、

分布错配下的扰动复杂度:强化学习在再生核希尔伯特空间下的系统分析


作者: 龙吉昊,韩劼群

doi: 10.4208/jml.220114


       强化学习是机器学习的一个领域,它关注决策者如何与未知环境进行多步交互以最大化预期的累积奖励。实际的强化学习问题往往拥有巨大的状态空间,需要使用函数逼近来表示价值函数或策略函数。但是,我们需要一个合适的状态变量的概率分布来估计价值函数或策略函数,而这个分布是未知的。原因是该分布是由待估计的价值或策略函数诱导的状态分布。这种现象在本文中被称为分布错配:用于估计的分布与当前的近似价值或策略函数诱导的分布之间的不匹配。这种现象在强化学习算法的分析中广泛存在,给分析带来了显著困难。本文为解决这一难题提供了一种新的视角。为了控制分布错配带来的误差,一个显然的充分条件是证明对于所有可能的策略诱导的概率分布,估计误差可以达到一致的小。本文证明了,在再生核希尔伯特空间下的强化学习问题中,这个条件也是必要的。此外本文还引入了一个关键的新概念,即分布错配下的扰动复杂度。该复杂度可以准确刻画相应强化学习问题的复杂性。

1.png


二、

有限温相互作用费米子体系:基于神经网络正则变换的第一性原理研究


作者:谢浩,张林峰,王磊

doi: 10.4208/jml.22011


       准确地预测量子物质的热力学性质是一直是物理学中一个具有挑战的问题。在有限温度下,大自然试图平衡能量和熵,以使物理系统进入自由能极小的状态。具有讽刺意味的是,试图将这一基本原理转化成模拟量子物质的实用算法却是相当困难的,尤其是对于那些由费米子组成的体系。这种困难主要来源于自由能中熵的高昂计算代价,也被称为“棘手的”配分函数问题。目前的工作利用生成型机器学习中的最新进展,使得这种自由能变分计算成为可能。

      生成型机器学习旨在对高维的概率分布建模、学习和采样。为了实现这些目标,机器学习领域发展了多种表达能力既强又可计算配分函数的神经网络模型。本文作者通过联合优化两个生成模型(一个用于经典玻尔兹曼分布、一个用于量子波函数),成功地模拟一个包含若干个电子的量子点体系。进一步将该方法应用于其它典型的量子物态(如均匀电子气和稠密氢)为这些问题提供了新的洞察。此外,本文也是一个将物理原理与机器学习技术相结合解决科学问题的例子。



2.png


三、

嵌入原则:深度神经网络损失景观的一种层次结构


作者:张耀宇,李雨晴,张众望,罗涛,许志钦

doi: 10.4208/jml.22010


      理解深度神经网络的损失景观显然对于分析训练轨迹和泛化能力非常重要。该工作提出了研究这个问题的一种新方法,即考察不同宽度神经网络损失景观的(嵌入)关系。文章证明了一个普适的嵌入原则——一个神经网络的损失景观“包含”所有更窄网络的临界点。文章也证明了(1)由窄网络嵌入得到的临界点构成子流形;(2)一个局部极小点在更宽的神经网络中更可能成为严格鞍点,反之不然。

3.png


四、

DeePN2:一种基于深度学习的非牛顿流体动力学模型


作者:方礼冬,葛沛, 张镭,鄂维南,雷欢

doi: 10.4208/jml.220115


      在非牛顿流体领域,一个长期困难的问题是如何建立可靠的宏观流体模型。该问题的难点在于,在非牛顿流体中,宏观尺度的方程(本构关系)往往依赖复杂的微观高分子动力学,并呈现多尺度效应,因此难以准确预测。对于这一具有挑战性的问题,本文提出了一种基于深度学习的非牛顿流体动力学模型:DeePN2。相对于传统经验模型和被广泛采用的基于机器学习的动力学模型,该模型具有以下四点优势。准确性:通过深度神经网络,DeePN2 建立了从分子尺度微观结构到流体宏观变量的直接映射;无需人工干预,该模型可准确区分由特定分子结构引起的宏观力学性质的不同,而传统模型往往无法捕捉这一差异;可解释性:通过比照微观动力学方程,该模型中各项均有明确物理意义,而传统基于深度学习的黑箱模型往往不具备可解释性;物理对称性:该模型严格满足旋转对称性,从而符合普适物理规律;高效性:该模型适用互相独立的分子构型训练集,训练过程不依赖时间导数信息,从而显著减小样本规模和训练误差,而主流的机器学习动力学模型往往需要时间序列作为训练样本。DeePN2为准确模拟复杂流体的流变与输运,以及控制软物质,纳米复合材料的合成过程提供一个新的计算模型框架。

4.png